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C 魔 法 概览 
例 说 编程 语言 
用 C 语 言 编程 的 基本 注意 事项 


主流 C 语 言 编 译 右 介绍 
关于 GNU 规 范 的 语法 扩展 
用 C 语 言 构建 一 个 可 执行 程序 的 流程 
本 章 小 结 

学 习 C 语 言 的 预备 知识 
计算 机 体系 结构 向 介 
整数 在 计算 机 中 的 表示 
浮 点 数 在 计算 机 中 的 表示 
地 址 与 字 节 对 齐 

字符 编码 

大 端 与 小 端 

按 位 逻辑 运算 

移 位 操作 


本 章 小 结 


第 5 章 


C 语 言 编 程 的 环境 搭建 
Windows 操 作 系 统 下 搭建 C 语 言 编程 环境 
macOS 系 统 下 搭建 C 语 言 编程 环境 
本 草 小 结 

基础 语法 篇 

C 语 言 中 的 基本 元 素 

C 语 言 中 的 字符 集 

C 语 言 中 的 token 

关于 C 语 言 中 的 “对 象 ” 

C 语 言 中 的 “副作用 >” 

C 语 言 标准 库 中 的 printf 函 数 

本 草 小 结 

基本 数据 类 型 

整数 类 型 

浮 点 类 型 

数据 精度 与 类 型 转换 

C 语 言 基本 运算 操作 符 
sizeof 操 作 符 

投射 操作 符 

本 草 小 结 


用 户 自 定义 类 型 


枚 举 类 型 

结构 体 类 型 
联合 体 类 型 
位 域 


C 语 言 的 数组 与 指针 

一 维 数组 

多 维 数 组 

变 长 数组 

一 级 指针 与 对 象 地 址 

多 级 指针 

指向 用 户 目 定义 类 型 的 指针 
指针 与 数组 的 关系 

指向 数组 的 指针 

void 类 型 、 指 向 void 类 型 的 指针 与 空 指针 
字符 数组 与 字符 串 字 面 量 
完整 与 不 完整 类 型 
灵活 的 数组 成 员 


本 章 小 结 


第 8 章 
8.1 
8.2 
8.3 
8.4 
8.5 
8.6 
8.7 
8.8 

第 9 章 
9.1 
9.2 
9.3 
9.4 
9.5 
9.6 
9.7 
9.8 
9.9 
9.10 
9.11 


C 语 言 的 控制 流 语句 


switch-case 语 句 
while 与 do-while 迭 代 语 句 
for 和 迭代 语 名 
goto 语 名 
本 章 小 结 
C 语 言 的 函数 
函数 的 声明 与 定义 
函数 调用 与 实现 
数组 类 型 作为 函数 形 参 
带 有 不 定 参数 类 型 及 个 数 的 函数 声明 与 调用 
函数 的 递归 调用 
内 联 函 数 
函数 的 返回 类 型 与 无 返回 酚 数 
指向 函数 的 指针 

C 语 言 中 的 主 范 数 main 

函数 与 函数 调用 作为 sizeof 操 作 符 


本 章 小 结 


第 10 章 “C 语 言 预 处 理 需 
10.1 宏 定 义 
10.2 C 语 言 中 预定 义 的 宏 
10.3 ”条 件 预 编译 
10.4 ” 源 文件 包含 预 处 理 指示 符 
10.5”#error 预 处 理 指示 符 
10.6” 执 ine 预 处 理 指示 符 
10.7 ”#undef 预 处 理 指示 符 
10.8 pragma 预 编译 指示 符 与 操作 符 
10.9” 空 指示 符 与 C 语 言 中 的 程序 注释 
10.10 ”本 章 小 结 
第 11 革 C 语 言 程序 的 编译 上 下 文 
11.1 CC 语言 程序 中 的 作用 域 和 名 字 空 间 
11.2 ”全 局 对 象 与 函数 
11.3 ”静态 对 象 与 函数 
11.4 局 部 对 象 
11.5 对象 的 存储 与 生命 周期 
11.6 ”_Thread_local 对 象 
11.7 本 章 小 结 
第 三 篇 ”高 级 语法 篇 


第 12 章 ”Ci 语言 中 的 类 型 限定 符 


const 限 定 符 
volatile 限 定 符 
restrict 限 定 符 
_Atomic 限 定 符 
本 章 小 结 

C 语 言 的 类 型 系统 
对 象 类 型 与 函数 类 型 
对 声明 符 的 进一步 说 明 
更 复杂 的 声明 
typedef 类 型 定 
本 章 小 结 


CI11 标 准 中 的 表达 式 、 左 值 与 求 值 顺序 


吾 言 中 的 左 值 
C 语 言 中 表达 式 的 求 值 顺序 
C 语 言 中 的 语句 
本 章 小 结 
函数 调用 约定 与 ABI 


Windows 操 作 系 统 环 境 下 x86 处 理 器 的 函数 调用 约定 
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Unix/Linux 操 作 系 统 环境 下 x86 处 理 器 的 函数 调用 约定 
ARM 处 理 器 环境 下 的 函数 调用 约定 

本 章 小 结 

创建 静态 库 与 动态 库 

Windows 系 统 下 创建 静态 库 与 动态 库 
macOS 系 统 下 创建 静态 库 与 动态 库 

Linux 系 统 下 创建 并 使 用 静态 库 与 动态 库 


本 章 小 结 


语法 扩展 篇 


GCC 对 C11 标 准 的 语法 扩展 

在 表达 式 中 使 用 复合 语句 与 声明 
声明 语句 块 作用 域 的 跳 转 标签 
跳 转 标签 作为 值 

熙 人 套 函 数 

使 用 typeof 来 获取 对 象 类 型 

使 用 auto_type 做 类 型 自动 推导 
对 复数 操作 的 扩展 

半 精 度 浮 点 类 型 

长 度 为 零 的 数组 


17.10 对 可 变 参数 个 数 的 宏 的 语法 扩展 
17.11 case 语句 中 使 用 范围 表达 式 


17.12 ”投射 到 一 个 联合 体 类 型 
17.13 ”使 用 二 进 制 整数 字面 量 
17.14 使 用 _attribute “指定 函数 、 对 象 与 类 型 的 属性 
17.15 本章 小 结 
第 18 章 ”Clang 编 译 络 对 C11 标 准 的 扩展 
18.1 特征 检查 宏 
18.2 _Nullable 与 Nonnull 
18.3 ” 画 数 重 载 
18.4 ”Blocks 语 法 
18.5 ”本 章 小 结 
第 19 章 “对 C 语 言 的 未 来 展望 
19.1 C 语 言 中 的 属性 
19.2 fallthrough 属 性 
19.3 ”数组 片段 
19.4 其 他 语法 特性 
19.5 本章 小 结 
第 五 篇 ”项 目 实 践 篇 
第 20 章 ”制作 UTF-8 与 UTF-16 编 码 字 符 串 的 转 码 器 
20.1 UTF-8 字 符 编 码 格式 
20.2 UTF-16 字 符 编 码 格式 
20.3 ”代码 示例 
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本 章 小 结 

制作 控制 侣 计算 需 

对 数字 的 解析 

对 操作 符 的 优先 级 处 理 
代码 示例 


本 章 小 结 


为 什么 要 写 这 本 书 


本 人 在 2001 年 上 了 大 学 本 科 ， 读 计算 机 科学 与 技术 专业 。 在 第 一 
年 的 上 半 学 期 ， 对 计算 机 编程 还 没什么 感觉 。 但 是 吏 在 考 “C 语 言 程序 
设计 ”这 门 专业 课 的 前 一 个 月 ， 感 觉 这 门 课 学 了 那么 久 几 乎 什么 都 不 
会 ， 可 把 我 急 坏 了 。 然 后 就 在 这 短 短 一 个 月 的 时 间 里 义 是 看 书 ， 又 是 
上 机 实验 ， 终 于 考 了 70 多 分 ， 算 是 过 天 了 .…….….. 不 过 奇怪 的 是 在 考试 结 
束 后 ， 束 发 现 目 己 对 编程 有 了 感情 。 到 了 大 二 ， 我 们 上 “数据 结构 ”所 
使 用 的 教材 古 基 于 C++ 编 程 语 言 的 ， 因 为 之 前 没 学 过 C++ 语 言 ， 所 以 
只 能 自学 。 而 在 这 个 过 程 中 ， 我 发 现 自己 对 编程 更 加 热爱 。 在 上 完 大 
三 之 后 ， 我 在 暑假 里 义 把 之 前 的 C 语 言 重新 巩固 一 番 。 有 了 计算 机 组 
成 、 操 作 系 统 、 汇 编 语言 、 数 据 结 构 等 知识 积淀 之 后 再 去 看 C 语 言 编 
程 束 感觉 容易 多 了 。 我 也 是 由 此 喜欢 上 了 C 编 程 语言 。 


10 年 之 后 ， 发 现 国内 市 面 上 很 多 C 语 言 参 考 书 仍然 显得 非常 陈 
旧 。 不 仅 基 于 古老 的 C89/90 标 准 ， 而 且 还 在 用 Visual C++6.0 这 种 既 收 
费 又 老 旧 的 开发 环境 教学 生 。 对 于 比较 新 的 C99 标 准 的 讲解 屈指 可 
数 ， 更 鲜 有 针对 最 新 的 C11 标 准 的 书籍 。 出 于 对 C 语 言 的 热爱 ， 在 此 热 


切 希 望 能 把 最 新 标准 的 C 语 言 奉献 给 各 位 读者 ， 也 想 把 C 语 言 的 方 方 面 

面 讲 透 并 且 能 讲 得 通俗 易 懂 ， 方 便 读者 去 思考 实践 ， 所 以 这 也 是 我 写 

这 本 书 的 主要 原因 。 当 各 位 阅读 完 本 书 之 后 ， 会 发 现 C 语 言 况 然 如 此 

强大 ! 而 且 在 大 部 分 时 候 ， 尤 其 是 我 们 想 集中 注意 力 解决 其 个 特定 问 

题 的 时 候 ， 使 用 C 语 言 要 比 用 其 他 一 些 基于 面向 对 象 的 类 C 编 程 语言 
(比如 C++、Java 等 ) 要 直观 得 多 | 


本 书 之 所 以 叫 "“C 语 言 编 程 魔 法 书 ”， 是 因为 像 < 宝典 ”\“ 圣 经 ”之 类 
的 词 已 经 被 用 滥 了 。 再 者 ，C 语 言 本 身 就 拥有 极其 强大 的 魔力 ， 你 能 
用 它 做 几乎 所 有 的 事情 。 而 且 几 乎 每 一 个 C 语 言 编译 器 都 能 内 联 汇编 
语言 ， 或 者 与 C++、Objective-C 直 接 兼容 ， 而 对 于 像 Java、C#、Python 
等 许多 编程 语言 也 有 相应 的 接口 。 所 以 ， 我 认为 C 语 言 在 计算 机 编程 
语言 领域 中 就 好 比 数 学 在 自然 科学 中 的 地 位 和 作用 ， 它 是 很 多 编程 语 
言 的 基础 ， 而 且 很 多 编程 语言 的 编译 器 或 解释 器 也 都 是 基于 C 语 言 
写 的 ” 


就 在 2015 年 2 月 ，Khronos 标 准 组 织 发 布 了 最 具 现代 化 的 图 形 API 
Vulkan， 其 主机 端 接口 用 的 API 是 纯 C 语 言 。 此 外 ， 像 OpenGL 、 
OpenCL、OpenAL、OpenVG 等 开放 标准 都 基于 纯 C 语 言 。 此 外 ， 最 近 
10 年 来 TIOBE 每 月 的 编程 语言 排名 ，C 语 言 排名 始终 能 进 前 两 名 ， 也 
能 说 明 它 的 使 用 范围 之 广 ， 而 且 许多 开源 项 目 也 多 多 少 少 会 使 用 C 语 
言 来 编写 。 况 且 学 了 C 语 言 之 后 ， 再 学 习 C++、Java 等 面向 对 象 编程 语 


言 也 会 轻松 很 多 。 尤 其 像 C++ 和 Objective-C， 没 有 C 语 言 基础 是 完全 不 
行 的 。 所 以 个 人 十 分 推荐 计算 机 系 的 大 学 生 将 C 语 言 作为 自己 的 计算 
机 入 门 编 程 语言 ! 


本 书 特色 


从 技术 层面 上 讲 ， 本 书 介 绍 了 C 语 言 的 最 新 标准 ， 即 ISO/IEC 
9899: 2011。 同 时 ， 也 介绍 了 主流 开源 C 语 言 编译 侣 GCC 与 Clang 对 标 
准 C 语 言语 法 的 扩充 。 而 且 所 基于 的 编译 器 和 开发 环境 也 是 比较 新 的 
Visual Studio Community 2017、GCC 5， 以 及 Clang 3.8 (Apple LLVM 
8.0， 基 于 Xcode 8) 。 


从 适合 读者 阅读 和 掌握 知识 的 结构 安排 上 讲 ， 本 书 分 为 “预备 知识 
篇 "、“ 基 础 语法 篇 "、“ 融 级 语法 访 "， 以 及 “语法 扩展 篇 "， 还 有 最 后 
的 “项 目 实践 篇 ”。 从 基础 到 高 级 ， 循 序 渐进 地 为 读者 描述 C 语 言 编程 
方法 。 本 书 尤其 着重 C 语 言 标准 语法 上 的 精确 描述 ， 通 过 许多 代码 片 
段 给 读者 介绍 各 种 C 语 言语 法 知识 ， 并 且 能 反映 出 C 语 言 的 灵活 性 以 及 
在 使 用 上 的 约束 。 


本 书 推崇 读者 使 用 合法 免费 的 C 语 言 编 译 器 以 及 集成 开发 环境 ， 
布 望 读者 能 有 正确 的 软件 版 权 意 识 ， 这 样 才 能 更 好 地 为 我 国 软件 事业 
增添 光彩 ， 为 打造 民 好 的 应 用 市 场 以 及 生态 环境 作出 页 献 。 因此， 本 


书 主要 选择 使 用 GCC、Clang 这 两 个 主流 开源 免费 的 C 语 言 编 译 占 ， 而 
集成 开发 环境 (IDE) 则 采用 Visual Studio Community、Eclipse、 
Xcode 这 三 个 常用 的 免费 开发 工具 ， 其 中 ，Visual Studio Community 不 
是 开源 的 ， 而 Xcode 则 是 部 分 开源 的 。 


本 书 虽 然 会 讲解 整个 C 编 程 语 言 ， 涉 及 了 几乎 所 有 的 语法 点 ， 但 
征 考 虑 到 本 书 读者 可 能 是 初学 C 语 言 ， 且 没有 多 少 计算 机 专业 知识 ， 
所 以 本 书 措辞 会 尽量 通俗 ， 而 不 过 于 追求 学 术 化 。 某 些 拉 述 可 能 会 不 
太 严 谨 ， 但 对 于 本 书 所 用 到 的 GCC、Clang 这 两 大 主流 编译 器 而 言 将 完 
全 适用 。 男 外 ， 考 虚 到 不 少 读者 从 事 租 入 式 系 统 开发 工作 ， 所 以 对 于 
C 语 言 标 准 中 出 现 的 所 谓 “ 由 实现 定义 的 ”场合 会 尽量 区 分 情况 分 别 阐 
明 。 本 书 的 最 终 的 目的 束 是 让 读者 至 少 能 熟练 掌握 C 语 言 编 程 ， 能 将 
它 灵 活 地 运用 于 实际 工程 中 。 


读者 对 象 


-嵌入 式 系统 开发 者 
.移动 或 昌 面 客户 端 应 用 程序 开发 着 
"服务 器 端 应 用 程序 开发 者 


系统 架构 师 


计算机、 电子 工程 、 通 信 专 业 的 大 学 生 


-其 他 对 C 语 言 编程 感 兴趣 的 人 员 


如 何 阅 谈 本 书 


本 书 一 共 分 为 四 大 篇 。 


预备 知识 篇 (第 1~3 章 ) ， 人 简单 描述 C 语 言 的 概况 、 学 习 C 语 言 的 
预备 知识 ， 以 及 在 Windows、macOS 和 Linux 三 大 桌面 环境 下 搭建 编写 
C 环 境 的 方法 。 


第 1 章 “C 魔 法 概览 。 主 要 介绍 C 语 言 的 来 历 和 演化 ， 用 它 编写 代 
码 的 编程 模式 以 及 我 们 可 以 用 于 实践 的 主流 C 语 言 编译 右 。 


第 2 章 ” 学 习 C 语 言 的 预备 知识 。 这 一 半 主 要 为 不 太 熟 悉 计 算 机 系 
统 的 读者 提供 一 些 基础 的 计算 机 理论 知识 和 相关 概念 ， 比 如 整数 与 浮 
点 数 在 计算 机 中 的 表示 方法 、 字 符 编 码 格式 、 按 位 逻辑 计算 、 移 位 操 
作 等 。 


第 3 革 C 语 言 编程 的 环境 搭建 。 这 一 章 主要 介绍 了 Windows 、 
macOS 以 及 Linux 系 统 下 如 何 安 儿 并 使 用 主流 编译 絮 与 集成 开发 环境 。 


基础 语法 篇 \ 第 4~11 章 ) 讲解 C 语 言 的 基本 语法 。 这 是 C 语 言 程 


第 4 章 C 语 言 中 的 基本 元 素 。 这 一 革 接 述 了 C 语 言 中 常用 字符 集 
以 及 合法 token 的 构成 。 此 外 还 介绍 了 标识 符 、 关 键 字 以 及 标点 符号 的 
使 用 说 明 。 


第 5 革 ”基本 数据 类 型 。 这 一 章 介 绍 了 整数 类 型 、 字 符 类 型 、 浮 点 
类 型 数据 的 表示 ， 以 及 它们 之 间 的 类 型 转换 。 此 外 还 描述 了 对 于 这 些 
基本 数据 类 型 的 算术 逻辑 操作 、 投 射 操作 以 及 通过 sizeof 操 作 符 获 取 数 
据 类 型 与 对 象 相 应 的 子 市 数 。 


第 6 章 ”用 户 自 定义 类 型 。 这 一 章 描述 了 枚 举 、 结 构 体 以 及 联合 体 
这 三 种 用 户 自 定义 类 型 ， 并 介绍 了 它们 的 特性 以 及 各 种 使 用 方式 。 


第 7 章 C 语 言 的 数组 和 指针 。 这 一 章 十 分 关键 ， 也 十 C 语 言 的 语 
法 难点 。 这 里 详细 介绍 了 C 语 言 中 一 维 数组 与 多 维 数组 的 表示 以 及 如 
何 对 它们 进行 操作 ， 然 后 介绍 了 C 语 言 中 的 指针 类 型 ， 详 细 曾 述 了 指 
针 类 型 的 使 用 技巧 以 及 需要 注意 的 事项 。 


第 8 草 ”C 语 言 的 控制 流 语句 。 这 一 章 介 绍 了 C 语 言 的 条 件 语句 、 
选择 语句 以 及 循环 等 控制 流 语句 。 


第 9 章 C 语 言 的 画 数 。 这 一 章 介绍 了 C 语 言 中 的 函数 概念 ， 包 括 C 
吾 言 画 数 的 声明 及 定义 ， 还 有 C 函 数 的 调用 。 此 外 还 介绍 了 C 语 言 玫 数 
标识 符 作 为 表达 式 时 的 类 型 。 


第 10 革 ”C 语 言 的 预 处 理 器 。 这 章 包 含 了 目前 C11 标 准 中 所 支持 的 
所 有 预 处 理 紫 特性 ， 包 括 宏 定义 、 预 处 理 条 件 、 预 编译 指示 符 与 操作 
和 从 以 及 C 代 码 的 注释 。 


第 11 章 ”C 语 言 的 编译 上 下 文 。 这 一 章 介 绍 了 C 语 言 对 象 与 画 数 的 
作用 域 和 和 名字 空 间 。 详 细 介 绍 了 C 语 言 中 的 四 大 作用 域 以 及 在 不 同 作 
用 域 中 的 对 象 的 生命 周期 。 此 外 还 介绍 了 对 象 与 钞 数 的 连接 属性 ， 

括 外 部 连接 和 内 部 连接 。 


高 级 语法 篇 (第 12~~16 章 ) 讲述 C 语 言 的 一 些 高 级 特性 。 这 一 部 
分 内 容 不 需要 C 语 言 程序 员 必 须 掌握 ， 但 需要 对 此 有 个 大 概 了 解 。 


第 12 革 ”C 语 言 中 的 类 型 限定 符 。 该 章 介 绍 了 C11 标 准 中 支持 的 
const、vVolatile、restrict 与 _Atomic 这 四 种 限定 符 。 话 细 说 明了 限定 符 用 
于 修饰 合 有 指针 的 对 象 时 ， 在 * 号 的 不 同位 置 所 起 到 的 不 同 作用 。 然 后 
分 别 介 绍 这 四 种 限定 符 的 具体 合 义 。 


第 13 革 C 语 言 中 的 类 型 系统 。 这 一 章 把 C 语 言语 法 体系 中 的 整个 
类 型 系统 再 梳理 了 一 这。 这 一 章 介绍 了 对 于 一 些 复杂 类 型 的 对 象 如 何 
去 剖析 、 理解 ， 然 后 目 己 如 何 去 声 明 目 己 想 要 的 复杂 类 型 的 对 象 和 画 


数 。 这 一 章 所 描述 的 其 实 是 整个 C 语 言语 法 体系 的 核心 ， 如 果 大 家 能 
掌握 的 话 ， 那 么 基本 束 算 是 真正 掌握 C 语 言 了 了。 其实， 对 于 任 一 强 类 
型 的 编程 语言 而 言 ， 其 系统 类 型 总 是 扮演 着 十 分 重要 的 角色 ， 我 们 学 
习 此 类 语言 都 需要 透彻 理解 其 整个 类 型 系统 。 


第 14 草 ”C11 标准 中 的 表达 式 、 左 值 与 求 值 顺 序 。 该 革 先 介绍 了 
C11 标 准 中 各 类 表达 式 以 及 它们 的 计算 优先 级 。 然 后 介绍 了 “ 左 值 ” 这 个 
概念 ， 并 讲解 了 表达 式 之 间 的 求 值 顺序 。 


第 15 章 ”函数 调用 约定 与 ABI。 该 草 与 C 语 言 标准 并 无 太 大 关系 ， 
但 却 与 实际 项 目 开 发 有 天。 这 一 章 介 绍 了 主流 C 语 言 编译 侨 所 采用 的 
玉 数 调用 约定 ， 然 后 详细 描述 了 函数 调用 的 过 程 ， 包 括 参 数 传递 和 返 
回 值 的 具体 处 理 。 该 章 对 筷 入 式 系统 开发 者 以 及 需要 将 C 语 言 与 汇编 
语言 进行 交互 使 用 的 高 性 能 计算 开发 者 而 言 ， 将 大 为 有 用 。 


第 16 革 ”创建 动态 库 与 静态 库 。 这 一 章 介 绍 了 用 主流 C 语 言 编译 
工具 构建 静态 库 以 及 动态 库 的 方法 ， 并 介绍 如 何 使 用 这 些 库 文件 。 


语法 扩展 篇 (第 17~ 人 19 章 ) 讲述 了 GCC 与 Clang 编 译 需 对 C 语 言 的 
扩展 。 


第 17 章 ”GCC 对 C11 标 准 的 扩展 。 该 章 先 简单 介绍 GNU 语 法 扩 
展 ， 然 后 介绍 GCC 编译 器 中 常用 的 扩展 语法 。 


第 18 章 “Clang 编 译 右 对 C11 标 准 的 扩展 。 该 章 介 绍 了 Clang 编 译 吉 
对 C11 标 准 的 语法 扩展 。 最 后 还 介绍 了 Apple 开 源 的 Grand Central 
Dispatch 库 的 简单 使 用 。 


第 19 章 ”对 C 语 言 的 未 来 展望 。 该 章 主要 介绍 了 C 语 言 的 设计 理念 
以 及 当前 C 语 言 标 准 委 员 会 的 工作 组 正在 为 C 语 言 新 增 的 内 容 ， 还 谈 到 
了 哪些 特性 不 会 被 添加 a 到 Ci 语言 中 去 。 


项 目 实践 篇 (第 20~21 章 ) ， 这 里 通过 两 个 实际 的 C 语 言 项 目 来 
介绍 我 们 如 何 利 用 C 语 言 来 创作 出 目 己 的 程序 。 


第 20 草 ”描述 了 UTF-8 编 码 格式 的 字符 串 与 UTF-16 编 码 格式 的 字 
符 串 进行 相互 转换 的 例子 。 


第 21 章 ”介绍 一 个 看 似 人 简单 而 功能 很 丰富 的 基于 控制 台 的 计算 郁 
程序 。 


建议 零 基础 的 读者 要 了 解 第 一 篇 的 预备 知识 ， 这 对 于 后 面 深入 学 
习 C 语 言 编程 很 有 帮助 。 男 外 ， 这 部 分 读者 可 以 先 不 用 强行 看 第 二 
篇 ， 尤 其 是 第 15 章 。 因 为 第 三 篇 涉及 的 知识 比较 深 ， 而 第 15 章 又 会 直 
接 引 入 汇编 语言 ， 这 对 于 没有 一 定 计算 机 专业 知识 的 读者 会 比较 难以 
理解 。 如 宁 是 有 一 定 计算 机 专业 知识 的 读者 可 以 略 过 第 一 篇 ， 直 接 阅 
读 第 二 篇 。 另 外 ， 如 有 果 是 从 事 舱 入 式 系统 开发 的 、 或 从 事 系 统 底层 开 


发 的 资深 程序 员 ， 建 议 仔细 阅 读 第 三 、 第 四 篇 ， 相 信 这 部 分 内 容 会 对 
你 的 工作 很 有 帮助 。 


勘误 和 文 持 


由 于 笔者 的 水 平 有 限 ， 编 写 时 间 仓 促 ， 书 中 难免 会 出 现 一 些 错 误 
或 者 不 准确 的 地 方 ， 乃 请 读者 批评 指正 。 如 果 你 有 更 多 的 宝贵 意见 ， 
欢迎 你 访问 我 的 个 人 博客 网 站 http://blog.csdn.net/zenny_chen 进 行 专题 
讨论 ， 我 会 尽量 在 线 上 为 你 提供 最 满意 的 解答 。 同 时 ， 你 也 可 以 通过 
微 博 http://weibo.com/zennylchen 与 我 联系 ， 或 发 送 电 子 邮件 到 
zenny_chen@163.com。 期 待 能够 得 到 你 们 的 真 健 反馈， 在 技术 之 路 上 
互 揭 共 进 。 另 外 ， 本 书 最 后 两 章 的 代码 可 以 在 作者 的 GitHub 上 获取 : 


https://github.com/zenny-chen ° 
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老板 对 我 写作 此 书 的 懂 舞 与 期 行 。 
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我 想 和 作者 聊 聊 


为 了 能 更 好 地 与 读者 进行 联系 ， 笔 者 这 里 留 了 一 个 QQ 讨论 群 。 各 
位 如 果 在 阅读 此 书 中 有 任何 疑问 可 以 来 本 群 询问 ， 大 家 可 以 一 起 探 
讨 。 各 位 可 以 扫 一 扫 下 方 的 二 维 码 ， 进 此 群 的 提示 语 为 : “C 语 言 编 程 
魔法 书 ”， 或 者 查询 群 号 86540289 申 请 入 群 。 


zenny_chen 作 者 读书 群 
扫 一 扫 二 维 码 ， 加 入 该 群 。 
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第 1 革 CC 魔法 概览 


括 它 的 历史 以 及 C 语 言 标准 的 演化 进程 。 然 后 介绍 一 下 C 语 言 编程 思 
想 ， 当 前 主流 C 语 言 编 译 器 以 及 GNU 语 法 扩展 。 最 后 简单 介绍 一 下 从 
用 C 语 言 编 写 程序 到 编译 、 构 建 一 个 可 执行 程序 的 大 致 过 程 。 


计算 机 编程 语言 从 对 计算 机 硬件 底层 的 抽象 程度 进行 分 类 ， 可 分 
为 : 机 器 语言 、 汇 编 语 言 以 及 高 级 语言 。 下 面 由 底层 到 高 层 分 别 介绍 
这 儿 种 类 别 的 编程 语言 。 


1.1 例 说 编程 语言 


1) 机 器 语言 是 直接 通过 十 六 进 制 数 表示 当前 处 理 器 架构 的 机 器 指 
令 码 。 指 令 码 包含 了 当前 指令 的 功能 (比如 算术 逻辑 运算 、 移 位 、 分 
支 、 中断 、1/O 等 ) 、 寄 存 器 、 立 即 数 等 多 种 元 素 。 每 种 处 理 器 架构 所 
对 应 的 机 器 码 的 字 节 长 度 也 各 不 相同 ， 有 些 是 固定 长 度 的 (比如 
ARM、MIPS 等 架构 ) ， 有 些 是 可 变 长 度 的 (比如 x86 架 构 ) 。 


2) 汇编 语言 (Assembly Language) 通过 人 简单 的 指令 助 记 符 
(memonics) 来 表示 对 应 机 右 指 令 的 功能 、 寄 存 器 编号 、 立 即 数 
(immediates) 等 元 素 。 汇 编 语 言 是 对 机 器 指令 的 简单 抽象 ， 通 过 汇 

编 器 (assembler) 可 以 将 汇编 语句 翻译 成 对 应 的 机 器 指令 码 。 


3) 高 级 语言 的 表达 形式 更 为 抽象 且 贴 近 我 们 日 党 的 语言 表述 。 而 
且 ， 高 级 语言 比 起 汇编 语言 往往 更 具有 表达 力 ， 且 拥有 更 加 丰富 的 语 
法 特性 ， 以 便 将 程序 进行 结构 化 和 模块 化 。 比 如 ， 高 级 语言 具有 目 定 
义 变量 标识 符 、 目 定义 数据 结构 、 分 文 与 循环 、 更 形象 目 然 的 表达 式 
等 。 高 级 语言 一 般 通 过 编译 器 (compiler) 可 直接 将 表达 式 翻 译 为 对 
应 的 机 器 指令 码 ， 也 可 以 将 高 级 语言 先 翻 译 为 中 间 语 言 (类 似 于 汇 
编 ， 但 可 能 比 汇编 适用 范围 更 广 、 更 利于 跨 平 台 的 字 节 人 码 ) ， 最 后 将 
中 间 语 言 翻 译 为 最 终 的 机 器 指令 码 。 


当然 ， 有 些 书 中 还 介绍 了 第 四 代 语 言 ， 它 基于 高 级 语言 ， 比 高 级 
语言 更 抽象 ， 只 需要 一 些 人 简单 的 描述 语句 束 能 让 计算 机 做 比较 复杂 的 
工作 。 比 如 SQL (结构 化 查询 语言 ， 用 于 数据 库 查 询 ) 算是 一 种 第 四 


Tole > 


下 面 ， 为 了 能 让 大 家 对 这 三 种 层次 的 编程 语言 有 一 个 感性 的 认 
识 ， 这 里 将 列举 ARMV8 架 构 处 理 器 下 的 机 器 语言 、 汇 编 语 言 ， 加 上 它 
们 相应 的 C 语 言 。 读 者 如 果 手 头 有 Xcode， 并 且 有 包含 Apple A7 或 更 高 
版 本 处 理 器 的 iO0S 设 备 的 话 ， 可 以 直接 编译 运行 ， 并 能 看 到 最 终 效 
果 o 


下 面 首先 列 出 一 个 文件 名 为 my_sub.s 的 汇编 源 文件 ， 其 中 包含 了 
机 器 语言 和 汇编 语言 。 见 代码 清单 1-1: 


代码 清单 1-1 机 器 语言 与 汇编 语言 


.text 
.align 4 


#ifdef arm64 


.globl _my_sub_machine 
.globl _my_sub_assembly 


// 用 机 器 语言 实现 减法 操作 


_my_sub_machine: 


.long Ox4b010000 
.long Oxd65f03c0 


// 用 汇编 语言 实现 减法 操作 
_my_sub_assembly: 


sub wO, wO, wl 


ret 


#endif 


在 代码 清单 1-1 中 ，_my_sub_machine 程 序 片 段 中 的 两 条 .long 语 句 
即 为 机 器 指令 。 这 两 条 机 器 指令 正好 与 _my_sub_assembly 中 的 两 条 汇 
编 指 令 相 对 应 。 也 就 是 说 , “0x4b010000” 这 串 32 位 的 十 六 进 制 代码 意 
思 就 是 “sub w0，w0，w1”， 表 示 将 寄存 器 w0 与 寄存 器 wl 的 值 进行 相 
减 ， 然 后 将 结果 写 回 w0 寄 存 器 中 。 而 “0xd65f03c0” 指 令 码 对 应 
于 “ret”( 更 确切 地 说 是 ret x30) ， 表 示 返 回 当前 过 程 (procedure) 
在 汇编 语言 中 ， 一 般 会 使 用 过 程 或 者 例 程 (routine) 来 表示 一 个 可 执 
行 的 程序 族 段 。 在 C 语 言 中 一 般 都 用 函数 (function) 表示 。 我 们 在 这 
里 能 够 明显 看 到 ， 汇 编 语 言 采 用 指令 助 记 符 的 方式 比 写 机 器 指令 人 码 要 
直观 得 多 ， 而 且 也 不 容易 出 错 。“sub” 指 令 的 功能 从 助 记 符 上 就 能 知道 
是 “减法 功能， 而 w0、w1 也 明确 指明 了 使 用 的 寄存 器 是 w0 和 w1。 这 
些 在 “0x4b010000” 这 种 机 器 指令 码 上 都 无 法 直观 地 表现 出 来 。 


代码 清单 1-2 列 出 C 语 言 是 如 何 表达 一 个 减法 操作 的 。 


代码 清单 1-2 ”减法 操作 对 应 的 C 语 言 


static int my_sub_c(int a, int b) 


return a - b; 


代码 清单 1-2 所 列 出 的 C 语 言 代码 与 代码 清单 1-1 中 的 机 器 指令 码 和 
汇编 语言 完全 对 应 ， 意 思 一 目 了 然 一 一 将 参数 变量 a 的 值 与 参数 变量 b 
的 值 进行 相 减 ， 然 后 将 结果 返回 。 从 这 里 我 们 束 能 看 到 机 套 语 言 、 汇 
编 语 言 以 及 以 C 语 言 为 代表 的 高 级 语言 之 间 在 表达 力 上 的 差距 了 。 高 
级 语言 的 目的 吏 是 为 了 给 程序 员 提供 更 恨 好 的 编程 工具 ， 更 向 话 、 更 
富有 表达 力 的 语言 ， 使 得 我 们 程序 员 能 提升 生产 力 ， 并 且 能 构思 出 更 
多 精彩 炫 酷 的 应 用 ， 而 不 是 把 太 多 的 精力 都 投入 在 如 何 让 计算 机 执行 
的 盎 访 下 


代码 清单 1-3 能 让 我 们 在 主 函 数 或 其 他 函数 中 测试 上 述 已 经 编写 好 
的 函数 。 


代码 清单 1-3 ”展示 减法 操作 的 结果 


#ifdef arm64 _ 


extern int my_sub_machine(int a, int b); 
extern int my_sub_assembly(int a, int b); 


int result_machine = my_sub_machine(10, 2); 

int result_assembly = my_sub_assembly(5, 3); 

int result c = my_sub_c(6, 2); 

printf("Three results: %d, %d, %d\n", result_ machine, result _ assembly, result_c); 


#endif 


执行 了 上 述 代 码 之 后 ， 我 们 最 后 能 在 控制 台 看 到 输出 结 
果 : “Three results: 8，2，4”。 可 见 ， 上 述 三 种 不 同 的 编程 语言 ， 计 
算 功 能 是 完全 一 致 败 ， 都 是 对 两 个 输入 参数 做 减法 操作 ， 然 后 返回 差 


值 。 然 而 就 可 读 性 、 可 理解 性 以 及 编程 便利 性 而 言 ， 显 然 C 语 言 比 起 
其 他 两 者 要 强 得 多 。 而 可 读 性 最 差 的 无 疑惑 是 机 器 指令 码 了 。 


1.C 语 言 的 类 别 与 产生 


对 于 高 级 语言 来 说 ， 从 表达 上 又 可 分 为 命令 式 编程 语言 
(imperative programming language) 和 陈述 型 编程 语言 (declarative 
programming language) 。 命 令 式 语言 主要 包括 过 程式 
(procedural) 、 结 构 化 (structured) 以 及 面向 对 象 (object-oriented) 
的 编程 语言 ， 陈 述 型 编程 语言 主要 包括 函数 式 (functional) 以 及 逻辑 
型 (ogical) 编程 语言 。 而 C 语 言 则 属于 结构 化 的 命令 式 编程 语言 。 不 
过 现在 很 多 命令 式 编 程 语言 也 包含 了 一 些 函 数 式 编程 语言 的 特征 。 在 
本 书 中 ， 后 面 第 18 章 中 谈 到 的 Blocks 语 法 就 是 一 个 很 典型 的 函数 式 编 
程 语言 的 语法 。 


C 语 言 最 初 由 Dennis Ritchie 于 1969 年 到 1973 年 在 AT&T 贝 尔 实验 室 
里 开发 出 来 ， 主 要 用 于 重新 实现 Unix 操 作 系统 。 此 时 ，C 语 言 又 被 称 
为 K&R C。 其 中 ，K 表 示 Kemighan 的 首 字母 ， 而 R 则 是 Ritchie 的 首 字 
。K&R C 语 言 与 后 来 标准 化 的 C 语 言 有 很 大 差异 。 比 如 ， 如 果 画 数 
返回 类 型 为 nt， 则 int 可 省 : int my_function () {}， 也 可 以 写成 
my_function () {}。 编译 器 不 会 有 任何 警告 ， 更 不 会 报错 。 另 外 ， 还 
有 现在 看 来 比较 奇 琵 的 画 数 定义 ， 像 我 们 现在 定义 这 么 一 个 函数 
void my_function (inta，char*p) {}， 如 果 是 用 K&R C 语 法 定义 的 话 


要 写成 : void my_function (a，p) inta; char*p; {}。K&R 的 C 语 法 
中 ， 定 义 一 个 函数 时 ， 其 形 参 列表 先 列 出 形 参 的 标识 符 ， 然 后 在 函数 
声明 的 后 面 紧 跟着 对 形 参 标识 符 的 完整 声明 ， 最 后 是 函数 体 。 这 在 现 
行 标准 中 已 经 被 逐步 废弃 使 用 了 。 另 外 ， 当 时 的 第 一 本 C 语 言 专 业 书 
《The C Programming Language》 也 并 非 一 个 正式 的 编程 语言 规范 ， 但 
被 用 了 许多 年 。 


2.C90 标 准 


由 于 C 语 言 被 各 大 公司 所 使 用 (包括 当时 处 于 鼎盛 时 期 的 IBM 
PC) ， 因 此 到 了 1989 年 ，C 语 言 由 美国 国家 标准 协会 (ANSI) 进行 了 
标准 化 ， 此 时 C 语 言 又 被 称 为 ANSI C。 而 仅 过 一 年 ，ANSI C 就 被 国际 
标准 化 组 织 ISO 给 采纳 了 。 此 时 ，C 语 言 在 ISO 中 有 了 一 个 官方 名 称 
一 一 ISO/IEC 9899: 1990。 其 中 ，9899 是 C 语 言 在 ISO 标准 中 的 代号 ， 
像 C++ 在 ISO 标准 中 的 代号 是 14882。 而 冒号 后 面 的 1990 表 示 当 前 修订 
好 的 版 本 是 在 1990 年 发 布 的。 对 于 ISO/IEC 9899: 1990 的 俗称 或 简 
称 ， 有 些 地 方 称 为 C89， 有 些 地 方 称 为 C90， 或 者 C89/90。 不 管 怎么 称 
呼 ， 它 们 都 指 代 这 个 最 初 的 C 语 言 国际 标准 。 这 个 版 本 的 C 语 言 标准 作 
为 K&R C 的 一 个 超 集 ( 即 K&R C 是 此 标准 C 的 一 个 子 集 ) ， 把 后 来 引 
入 的 许多 非 官 方 特性 也 一 起 整合 了 进去 。 其 中 包括 了 从 C++ 借鉴 的 画 
数 原型 (Function Prototypes) ， 指 向 void 的 指针 ， 对 国际 字符 集 以 及 


本 地 语言 环境 的 支持 。 在 此 标准 中 ， 尽 管 已 经 将 函数 定义 的 方式 改 为 
现在 我 们 常用 的 那 种 方式 ， 不 过 K&R 的 语法 形式 仍然 兼容 。 


3.C99 标 准 


在 随后 的 儿 年 里 ，C 语 言 的 标准 化 委员 会 又 不 断 地 对 C 语 言 进行 改 
进 ， 到 了 1999 年 ， 正 式 发 布 了 ISO/IEC 9899: 1999， 简 称 为 C99 标 准 。 
C99 标 准 引 入 了 许多 特性 ， 包 括 内 联 函 数 (inline functions) 、 可 变 长 
度 的 数组 、 灵 活 的 数组 成 员 (用 于 结构 体 ) 、 复 合 字 面 量 、 指 定 成 员 
的 初始 化 器 、 对 IEEE754 浮 点 数 的 改进 、 文 持 不 定 参数 个 数 的 安定 
义 ， 在 数据 类 型 上 还 增加 了 long long int 以 及 复数 类 型 。 训 不 夸张 地 
说 ， 即 便 到 目前 为 止 ， 很 少 有 C 语 言 编译 器 是 完整 文 持 C99 的 。 像 主流 
的 GCC 以 及 Clang 编 译 句 都 能 文 持 高 达 90% 以 上 ， 而 微软 的 Visual 
Studio 2015 中 的 C 编 译 右 只 能 文 持 到 70% 左 右 。 


4.C11 标 准 


2007 年 ，C 语 言 标准 委员 会 又 重新 开始 修订 C 语 言 ， 到 了 2011 年 正 
式 发 布 『ISO/IEC 9899: 2011， 简 称 为 C11 标 准 。C11 标 准 新 引入 的 特 
征 尽管 没 C99 相 对 C90 引 入 的 那么 多 ， 但 是 这 些 也 都 十 分 有 用 ， 比 如 : 
字 节 对 齐 说 明 符 、 泛 型 机 制 (generic selection) 、 对 多 线程 的 支持 、 
静态 断言 、 原 子 操作 以 及 对 Unicode 的 支持 。 本 书 将 主要 针对 C11 标 准 
为 大 家 详细 讲解 C 编 程 语言 。 关 于 C 语 言 历史 与 演化 进程 的 详细 介绍 可 


参考 维基 百科 : 
https://en.wikipedia.org/wiki/C_%28programming language%29° 


笔者 近 两 年 也 是 在 不 断 地 了 解 C 语 言 标准 委员 会 的 最 新 动态 (可 
参见 :http://www.open-std.org/jtcl/sc22/wg14/) ， 其 中 看 到 有 人 提出 想 
为 C 语 言 添加 面向 对 象 的 特性 ， 包 括 增加 类 、 继 承 、 多 态 等 已 被 C++ 语 
言 所 广泛 使 用 的 语法 特性 ， 但 是 最 终 被 委员 会 驳回 了 了。 因为 这 些 复 杂 
的 语法 特性 并 不 符合 C 语 言 的 设计 理念 以 及 设计 哲学 ， 况 且 C++ 已 经 有 
了 这 些 特性 ，C 语 言 无 需 再 对 它们 进行 文 持 。 笔 者 将 在 第 19 章 给 大 家 
谈 谈 C 语 言 设 计 理 念 与 发 展 方向 。 


1.2 用 CC 语言 编程 的 基本 注音 事项 


C 语 言 的 发 明 其 实 基 于 Unix 操 作 系统 。 当 时 在 C 语 言 未 面世 之 前 ， 
Dennis Ritchie 所 在 的 AT&T 贝 尔 实验 室 用 的 Unix 系 统 是 完全 用 汇编 语 
言 写 的 。 汇 编 语 言 的 优势 是 直接 面向 处 理 器 本 身 ， 能 直接 对 底层 硬件 
进行 控制 ， 充 分 发 挥 处 理 器 的 便 件 能 力 。 然 而 ， 它 的 缺陷 也 是 显 而 易 
见 的 。 


1 .汇编 语言 的 不 足 


首先 ， 不 可 移植 性 。 每 种 处 理 需 ， 其 指令 集 都 大 相 径 庭 ， 比 如 
ARM 有 ARM 的 指令 集 架 构 (ISA) ，Intel x86 有 x86 的 ISA， 还 有 
MIPS、Power (原来 为 PowerPC) ，Motorola 68000 等 ， 再 加 上 各 类 微 


控制 器 单元 (Micro-Controller Unit，MCU) 、 各 类 数字 信号 处 理 器 


(Digital Signal Processor，DSP) ， 每 种 ISA 都 有 其 相应 的 汇编 语言 。 
那么 多 处 理 器 如 果 对 每 一 种 都 使 用 不 同 的 汇编 语言 来 实现 同一 个 操作 
系统 ， 那 操作 系统 的 开发 人 员 真 要 裔 省 了 .…… 而 且 即 便 实 现 出 来 ， 可 
能 各 个 处 理 器 上 的 实现 也 会 有 所 不 同 ， 标 准 也 很 难 被 统一 起 来 。 


其 次 ， 汇 编 语言 本 身 要 比 高 级 语言 精密 。 因 为 汇编 语言 面 对 的 都 
苹 寄 存 右 、 存 储 右 以 及 各 类 底层 人 硬件， 而 不 古 一 种 抽象 的 数据 模型 ， 
所 以 代码 编写 时 需要 非常 谍 慎 ， 而 且 调 试 程序 也 十 分 麻烦 ， 且 非常 容 


易 出 错 。 所 以 ， 如 果 有 一 种 既 能 面 癌 底层 硬件 ， 又 能 对 数据 以 及 程序 
进行 抽象 的 高 级 语言 出 现 ， 那 势必 既 能 不 太 影 啊 程序 执行 效率 ， 又 能 
大 大 提升 程序 的 可 执行 性 、 可 读 性 以 及 编写 的 效率 ， 这 将 是 非常 伟大 
的 贡献 。C 语 言 也 束 是 在 这 种 育 景 下 诞生 的 。 


如 果 说 ， 汇 编 语言 面 癌 的 是 确 层 硬件 、 一 种 过 程 化 的 编程 风格 的 
话 ， 那 么 C 语 言 束 是 面向 数据 流 和 算法 、 一 种 结构 化 的 编程 风格 。C 语 
言 是 一 种 结构 化 的 、 静 仿 类 型 的 编译 型 编程 语言 。 也 殉 是 说 ， 用 C 语 
言 编写 了 源 代 码 之 后 ， 需 要 通过 C 语 言 编译 万 进行 编译 ， 构 建 为 相应 
的 处 理 絮 能 直接 执行 的 机 器 码 ， 然 后 处 理 絮 可 以 对 生成 出 来 的 机 右 码 
进行 执行 。 所 以 在 各 个 处 理 嚣 上， 处 理 紫 厂商 或 第 三 方 只 需要 为 当前 
处 理 器 写 一 个 对 应 的 C 语 言 编译 器 即 可 。 然 后 任何 符合 C 语 言 标准 的 程 
序 都 能 在 上 面 编译 后 执行 ， 除了 需要 文 持 菏 些 机 右 符 定 的 功能 和 特性 
个 了 局面 会 放生 ) 六 


2.C 语 言 编写 程序 要 注意 什么 

那么 我 们 在 用 C 语 言 写 程序 的 时 候 应 该 注意 哪些 方面 呢 ? 

1) 可 移植 性 : C 语 言 被 设计 出 来 的 一 大 初 袁 就 是 为 了 能 将 同一 个 
源 代 码 放 到 各 个 不 同 的 平台 上 编译 运行 。 因 此 ， 如 果 我 们 的 代码 要 在 
多 种 不 同 架 构 的 处 理 右 上 运行 的 话 ， 我 们 束 得 注意 C 语 言 标准 规定 了 
哪些 特性 是 编译 事 必 须 遵守 的 ， 哪 些 特性 是 平台 或 编译 右 目 己 实 现 


的 。 我 们 要 尽量 使 用 标准 中 已 明文 规定 的 编程 规范 ， 尽 可 能 避免 在 不 
同 平台 可 能 会 产生 不 同行 为 的 语法 特性 。 当 然 ， 由 于 上 面 提 到 的 处 理 
絮 种 类 太 过 多 样 ， 尤 其 在 租 入 式 开发 领域 ,很 多 MCU 用 的 还 都 十 8 位 
处 理 硕 ， 这 种 情况 下 C 源 代码 就 很 难 被 移植 到 32 位 或 64 位 系统 下 了 。 
本 书后 面 将 会 指出 大 部 分 主流 平台 对 C 语 言 标准 中 所 提 到 的 “实现 定 
义 ” 行 为 的 区 别 。 男 外 ， 也 会 提 到 一 些 技 巧 来 应 对 不 同 的 平台 特性 。 


2) 可 维护 性 ， 可 维护 性 在 实际 工程 项 目的 研发 中 非常 重要 。 它 体 
现在 最 初 工程 染 构 的 设计 、 对 各 个 功能 模块 的 划分 、 相 应 的 开发 人 员 
安排 ， 还 有 后 期 的 测试 。 一 般 来 说 ， 现 在 一 个 工程 如 果 是 从 无 到 有 进 
行 开发 的 话 会 采用 螺旋 式 开 发 模型 。 也 天 是 说， 一 个 项 目 局 动 后 ， 可 
以 先 做 一 个 功能 稍 单 但 能 正 芝 工作 的 产品 原型 。 然 后 在 此 基础 上 不 断 
地 为 它 增加 更 多 功能 ， 或 对 之 前 的 功能 进行 修改 。 在 此 期 间 ， 我 们 如 
何 对 整个 工程 进行 模块 化 划分 ， 从 而 能 安排 不 同 开发 人 员 针 对 不 同 功 
能 模块 进行 开发 束 变 得 尤为 重要 。 男 外 ， 在 工程 开发 过 程 中 ， 如 琳 有 
人 员 流 动 ， 那 么 如 何 将 即将 离职 的 开发 人 员 手 中 的 工作 交付 给 新 人 也 
关系 到 整个 项 目的 进展 。 因 此 ， 一 个 民 好 的 C 语 言 代码 应 该 具有 可 读 
性 、 民 好 的 文档 化 注释 风格 ， 以 及 较 详细 的 设计 文档 。 对 于 一 个 较 大 
的 工程 项 目 来 说 ， 开 发 人 员 不 仅仅 需要 把 目 己 的 代码 写 好 ， 而 且 要 写 
得 能 让 别人 看 懂 ， 并 且 要 做 好 详细 的 设计 文档 ， 这 样 才 能 把 项 目 风 险 
降低 。 


3) 可 延展 性 : 大 家 或 许 已 经 知道 ， 像 微软 的 windows 操 作 系统 

数 千 名 工程 师 合 作 人 研发 ，Linux 操 作 系 统 对 外 开源 ， 参 与 其 中 的 研发 人 
员 也 有 数 百 上 千 人 。 如 果 我 们 在 一 个 开发 团队 中 负责 一 个 需要 由 多 人 
合作 开发 的 工程 项 目 ， 那 么 我 们 写 的 功能 模块 需要 与 其 他 人 写 的 功能 
模块 进行 对 接 。 所 以 ， 我 们 在 开发 一 个 较 大 工程 项 目 时 ， 需 要 协调 好 
各 自 对 外 的 模块 接口 (Application Program Interface，API) 。 由 于 C 语 
言 没 有 全 局 名 字 空 间 (namespace) 这 个 概念 ， 所 以 命名 一 个 对 外 接口 
也 是 非常 重要 的 ， 否 则 可 能 会 与 其 他 功能 模块 的 接口 名 发 生 冲 突 。 本 
书后 面 会 对 C 语 言 函 数 命名 以 及 符号 连接 做 进一步 介绍 。 


4) 性 能 : 性 能 是 提升 程序 使 用 着 效率 和 生产 力 的 体现 。 一 个 应 用 
程序 的 性 能 越 高， 那么 计算 一 个 任务 所 花费 的 时 间 越 短 ， 也 越 节 省 计 
算 机 的 耗 电 。 而 对 于 如 何 提升 性 能 ， 一 方面 需要 程序 员 对 处 理 需 好 
构 、 硬 件 特性 有 一 定 了 解 ， 另 一 方面 需要 程序 员 拥 有 比较 丰富 的 算法 
知识 ， 能 针对 实际 需求 灵活 采用 高 效 的 算法 。 而 像 C 语 言 这 种 十 分 接 
近 硬 件 底 层 的 高 级 编程 语言 ， 能 极 大 限度 地 发 挥 处 理 吉 的 特长 ， 从 而 
达到 高 效 的 运行 性 能 。 


1.3 主流 C 语 言 编 详 项 介绍 


对 于 当前 主流 桌面 操作 系统 而 言 ， 可 使 用 Visual C++、GCC 以 及 
LLVM Clang 这 三 大 编译 器 。 其 中 ，Visual C++ (简称 MSVC) 只 能 用 于 
Windows 操 作 系 统 ; 其 余 两 个 ， 除 了 可 用 于 Windows 操 作 系统 之 外 ， 主 
要 用 于 Unix/Linux 操 作 系 统 。 像 现在 很 多 版 本 的 Linux 都 默认 使 用 GCC 
作为 C 语 言 编 译 器 。 而 像 FreeBSD、macOS 等 系统 默认 使 用 LLVM Clang 
编译 作 。 由 于 当前 LLVM 项 目 主要 在 Apple 的 主推 下 发 展 的 ， 所 以 在 
macOS 中 ，Clang 编 译 器 又 被 称 为 Apple LLVM 编 译 器 。MSVC 编 译 器 主 
要 用 于 Windows 操 作 系 统 平台 下 的 应 用 程序 开发 ， 它 不 开源 。 用 户 可 以 
使 用 Visual Studio Community 版 本 来 免费 使 用 它 ， 但 是 如 果 要 把 通过 
Visual Studio Community 工 具 生 成 出 来 的 应 用 进行 商用 ， 那 么 束 得 好 好 
阅读 一 下 微软 的 许可 证 和 说 明 书 了 。 而 使 用 GCC 与 Clang 编 译 锋 构建 出 
来 的 应 用 一 般 没 有 任何 限制 ， 程 序 员 可 以 将 应 用 程序 随意 发 布 和 进行 
商用 。 不 过 由 于 MSVC 编 译 器 对 C99 标 准 的 支持 就 十 分 有 限 ， 加 之 它 压 
根 不 支持 任何 C11 标 准 ， 所 以 本 书 的 代码 例子 不 会 针对 MSVC 进 行 描 
述 。 所 幸 的 是 ，Visual Studio Community 2017 加 入 了 对 Clang 编 译 器 的 
支持 ， 官 方 称 之 为 一 一 Clang with Microsoft CodeGen， 当 前 版 本 基于 的 
是 Clang 3.8。 也 就 是 说 ， 应 用 于 Visual Studio 集 成 开发 环境 中 的 Clang 编 
译 右 前 端 可 文 持 Clang 编 译 侣 的 所 有 语法 特性 ， 而 后 端 生 成 的 代码 则 与 
MSVC 效 果 一 样 ， 包 括 像 long 整 数 类 型 在 64 位 编译 模式 下 长 度 仍然 为 4 


个 字 季 ， 所 以 各 位 使 用 的 时 候 也 需要 注意 。 为 了 方便 描述 ， 本 书后 面 
涉及 Visual Studio 集 成 开发 环境 下 的 Clang 编 译 器 简称 为 VS-Clang 编 详 


口 避 
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而 在 巷 入 式 系统 方面 ， 可 用 的 C 语 言 编译 器 就 非常 丰富 了 。 比 如 用 

于 Keil 公 司 51 系 列 单片机 的 Keil C51 编 译 器 ， 当 前 大 红 大 紫 的 Arduino 板 
搭载 的 开发 套件 ， 可 用 针对 AVR 微 控制 三 的 AVR GCC 编 译 右 ; ARM 日 
己 出 的 ADS (ARM Development Suite) 、RVDS (RealView 
Development Suite) 和 当前 最 新 的 DS-5 Studio; DSP 设 计 商 TI (Texas 
Instruments) 的 CCS (Code Composer Studio) ; DSP 设 计 商 ADI 

(Analog Devices，Inc.) 的 Visual DSP++ 编 译 器 ， 等 等 。 通 常 ， 用 于 藤 
入 式 系统 开发 的 编译 工具 链 都 没有 免费 版 本 ， 而 且 一 般 需 要 通过 国内 
代理 进行 购买 。 所 以 ， 这 对 于 个 人 开发 者 或 者 嵌入 式 系统 爱好 者 而 言 
是 一 道 不 低 的 门槛 。 不 过 Arduino 的 开发 套件 是 可 免费 下 载 使 用 的 ， 并 
且 用 它 做 开发 板 连 接 调试 也 十 分 简单 。Arduino 所 采用 的 C 编 译 器 是 基 
于 GCC 的 。 还 有 像 树 莓 派 (Raspberry Pi) 这 种 迷你 电脑 可 以 直接 使 用 
GCC 和 Clang 编 译 器 。 此 外 ， 还 有 像 nVidia 公 司 推出 的 Jetson TK 系列 开 
发 板 也 可 直接 使 用 GCC 和 Clang 编 译 器 。 树 和 侮 派 与 Jetson TK 都 默认 安装 
了 Linux 操 作 系 统 。 在 向 入 式 领域 ， 一般 比较 低 端 的 单片机 ， 比 如 8 位 
的 MCU 所 对 应 的 C 编 译 侣 可 能 只 文 持 C90 标 准 ， 有 些 甚 至 连 C90 标 准 的 
很 多 特性 都 不 支持 。 因 为 它们 一 方面 内 存 小 ，ROM 的 容量 也 小 ;， 男 一 
方面 ， 本 号 处 理 圳 机 能 就 十 分 有 限 ， 有 些 甚至 无 法 文 持 函 数 指针 ， 


为 处 理 器 本 身 不 包含 通过 寄存 器 做 间接 过 程 调 用 的 指令 。 而 像 32 位 处 


理 器 或 DSP， 一 般 都 至 少 能 支持 C99 标 准 ， 它 们 本 身 的 性 能 也 十 分 强 
大 。 而 像 ARM 出 的 RVDS 编 译 器 甚至 可 用 GNU 语 法 扩展 。 


图 1-1 展 示 了 上 壕 C 语 言 编译 器 的 分 类 。 


Windows 系 统 
Unix/Linux 系 统 
Keil C51 a 

AVR GCC C 语 言 编译 器 OS X/iOS 系 统 

ARM 架 构 平台 A 
RVCT 嵌入 式 系统 端 
DS-5 Studio 
GCS 


Visual DSP++ 


图 1-1 C 语 言 编 详 侣 的 分 类 


1.4 关于 GNU 规 苑 的 语法 扩展 


GNU 是 一 款 能 用 于 构建 类 Unix 操 作 系 统 的 计算 机 软件 合集 ， 由 自 
由 软件 之 父 Richard Stallman 开 创 ， 于 1983 年 9 月 27 日 对 外 发 布 。GNU 
完全 由 上 自由 软件 (free software) 构成 。GNU 语 法 扩展 源 目 于 GCC 编译 
器 ， 在 1987 年 发 布 1.0 版 本 ， 称 为 GNU C Compiler 。 随 后 ，GCC 编 译 器 
前 端 山 支持 了 C++、Objective-C/C++、Fortran、Ada、Java 以 及 最 近 跃 
升 的 Go 等 编程 语言 ， 因 此 现在 GCC 被 称 为 GNU Compiler Collection。 
由 于 在 20 世 纪 90 年 代 ，GNU C 编 译 器 就 对 C90 标 准 做 了 相当 多 的 语法 
扩展 ， 包 括 复合 字面 量 、 匿 名 结构 体 和 数组 、 可 指定 的 初始 化 器 等 ， 
这 些 语 法 扩展 被 广泛 使 用 ， 尤 其 是 大 量 用 于 Linux 内 核 代 码 中 ， 因 此 
C99 标 准将 这 些 语法 特性 全 都 列 入 标准 之 中 。 


正 因为 GCC 本 里 是 开源 自由 软件 ， 因 此 很 多 商用 编译 全 也 基于 
GCC 进行 扩展 。 像 ARM 的 RVCT (RealView Compiler Toolkit) 本 身 就 
支持 GNU 扩 展 。 还 有 不 少 开发 平台 本 号 就 直接 使 用 GCC 编 译 工 具 。 由 
于 有 不 少 大 公司 顶级 开发 人 员 的 参与 ， 因 此 GCC 编译 器 的 目标 代码 优 
化 能 力 相 当 高 ， 而 且 还 文 持 许 多 不 同 的 处 理 器 。 所 以 ，GCC 当 前 被 广 
泛 使 用 并 博得 开发 者 的 好 评 。 像 Linux 操 作 系统 基本 默认 使 用 GCC 作为 
默认 编译 器 ， 包 括 Android 的 NDK 开 发 工具 一 开始 也 是 如 此 。 


然而 ， 由 于 GCC 基于 比较 严格 的 GPL 许可 证 ， 许 多 大 型 商业 开发 
商 对 它 望 而 却步 。 该 许可 证 允许 使 用 者 免费 使 用 软件 ， 但 是 要 求 不 能 
随意 对 它 进行 自 改 并 重新 发 布 。 如 果 开 发 者 对 它 进行 自 改 ， 然 后 发 布 
目 己 修改 之 后 的 软件 ， 那 么 必须 要 把 目 己 修改 的 那 部 分 也 开源 出 来 。 
因此 ， 在 2003 年 诞生 了 一 个 LLVM 开 源 项 目 ， 基 于 更 为 宽松 的 BSD 许 
可 证 ， 其 编译 器 称 为 Clang。BSD 许 可 证 允许 开发 者 随意 对 软件 进行 修 
改 并 重新 发 布 ， 甚 至 可 以 将 修改 过 的 版 本 作为 自主 版 权 ， 因 而 这 个 许 
可 证 深 受 大 公司 的 欢迎 。 现 在 Apple 对 LLVM 项 目的 投入 非常 大 。 
macOS 上 的 开发 工具 Xocde 从 4.0 版 本 起 就 开始 使 用 Clang 编 译 工具 链 ， 
随后 Apple 将 目 己 改写 的 Clang 编 译 器 称 为 Apple LLVYVM。 当 前 最 新 的 
Xcode 8 所 使 用 的 Apple LLYVM 版 本 为 8.x。 而 当前 Android NDK 也 文 持 
了 Clang 编 译 器 工具 链 。Clang 编 译 需 并 非 基 于 GCC， 它 是 从 头 开 始 写 
的 。 但 是 它 的 目标 是 尽量 与 GCC 编 译 器 兼容 ， 所 以 Clang 编 译 器 包含 大 
部 分 GNU 语 法 扩展 ， 除 此 之 外 还 含有 它 目 己 特有 的 C 语 言 扩展 。 当 然 
也 有 一 些 特性 是 GCC 含有 而 Clang 不 具备 的 ， 不 过 这 些 特性 一 般 很 少 使 
用 o 


我 们 现在 可 以 看 到 GNU 语 法 扩展 适用 性 十 分 广泛 。 如 果 读 者 当前 
在 做 Linux/Unix 或 Windows 上 的 C 语 言 编程 开发 ， 或 者 是 在 开发 
macOS/iOS 应 用 ， 又 或 者 是 在 开发 Android 应 用 ， 那 么 完全 可 以 毫 无 顾 
忌 地 使 用 GNU 语 法 扩展 。 本 书 最 后 几 个 章节 会 分 别 介绍 GCC 编译 器 特 
定 的 语法 扩展 以 及 Clang 编 译 器 特定 的 语法 扩展 。 由 于 Clang 编 译 器 已 


经 包含 了 大 部 分 GNU 语 法 扩展 ， 因 此 在 介绍 GCC 语法 扩展 的 时 候 ， 如 
果 当 前 特性 Clang 不 支持 ， 则 会 指明 。 


[1] 源 代 码 编 译 流 程 请 见 1.5T 图 1-2 。 


1.5 用 C 语 言 构建 一 个 可 执行 程序 的 流程 


从 用 C 语 言 写 源 代码 ， 然 后 经 过 编译 器 、 连 接 器 到 最 终 可 执行 程序 
的 流程 图 大 致 如 图 1-2 所 示 。 


从 图 1-2 中 我 们 可 以 清晰 地 看 到 C 语 言 编 译 器 的 大 致 流程 。 首 先 ， 
我 们 先 用 C 语 言 把 源 代码 写 好 ， 然 后 交 给 C 语 言 编译 占 。C 语 言 编译 右 
内 部 分 为 前 端 和 后 闻 。 前 端 负责 将 C 语 言 代码 进行 词法 和 语法 上 的 解 
析 ， 然 后 可 以 生成 中 间 人 代码。 中间 代码 这 部 分 不 是 必须 的 ， 但 古 它 能 
够 为 程序 的 跨 平台 移植 市 来 诸多 好 处 。 比 如， 同样 的 一 份 C 语 言 源 代码 
于 一 台 计 算 机 上 编译 完 之 后 ， 生 成 一 父 中 间 代 码 。 然 后 针对 不 同 的 目 
标 平台 (比如 要 将 这 一 套 代码 分 别 编译 成 ARM 处 理 器 的 二 进 制 机 器 
码 、MIPS 处 理 器 的 二 进 制 机 器 码 以 及 x86 处 理 器 的 二 进 制 机 器 码 ) ， 只 
需要 编写 相应 目标 平台 的 编译 器 后 端 即 可 。 所 以 ， 这 么 做 就 可 以 把 编 
译 器 的 前 端 与 后 端 剥 离开 来 〈 这 在 软件 工程 上 又 可 称 为 解 耦合 ) ， 不 
同 处 理 万 广 商 可 以 针对 目 家 的 处 理 亏 特性 ， 对 中 间 代 码 生 成 到 目标 二 
进 制 代码 的 过 程 再 度 进 行 优化 。 接 下 来 ， 由 C 语 言 编译 只 后 端 生成 源 文 
件 相应 的 目标 文件 。 目 标 文件 在 Windows 系 统 上 往往 是 .obj 文 件 ， 而 在 
Unix/Linux 系 统 上 往往 是 .o 文 件 。C 语 言 的 源 文件 在 所 有 平台 上 都 统一 
用 .c 文 件 表示 。 最 后 ， 对 于 各 个 独立 的 目标 文件 ， 通 过 连接 器 将 它们 合 
并 成 一 个 最 终 可 执行 文件 。 连 接 器 与 C 语 言 编译 器 是 完 全 独立 的 。 所 


以 ， 只 要 最 终 目 标 代码 的 ABI 〈 应 用 程序 二 进 制 接口 ) 一 致 ， 我 们 可 以 
把 各 个 编译 器 生成 的 目标 代码 都 放 在 一 起 ， 最 后 连接 生成 一 个 可 执行 
文件 。 比 如 ， 有 些 源 代 码 可 用 GCC 编译 ， 有 些 使 用 Clang 编 译 ， 还 有 些 
汇编 语言 源 文件 可 直接 通过 汇编 器 生成 目标 代码 ， 最 后 将 所 有 这 些 生 
成 出 来 的 目标 代码 连接 为 可 执行 文件 。 最 终 用 户 可 以 在 当前 的 操作 系 
统 上 加 载 可 执行 文件 进行 执行 。 操 作 系 统 利 用 加 载 器 将 可 执行 文件 中 
相关 的 机 器 码 存 放 到 内 存 中 来 执行 应 用 程序 。 


源 文件 源 文件 


编译 此 前 端 (词法 解析 ， 语 法 解析 ) 


编译 器 后 端 ( 生 成 目标 平 合 相 关 的 机 器 码 ) 
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图 1-2 C 语 言 源 代码 编译 流程 图 


1.6 本章 小 结 


本 章 简要 地 介绍 了 计算 编程 语言 的 分 类 ， 描 述 了 C 语 言 的 历史 及 
演化 ， 以 及 C 语 言 的 编程 思想 。 此 外 还 介绍 了 GNU 的 来 龙 去 脉 以 及 C 语 
言 编译 硕 将 C 语 言 代码 翻译 成 最 终 机 融 码 的 大 致 流程 。 


C 语 言 作为 一 门 更 接近 硬件 底层 的 高 级 编程 语言 具有 民 好 的 抽象 
力 、 表 达 力 和 灵活 性 。 此 外 ， 它 具有 非常 高 效 的 运行 时 性 能 。 当 前 的 
C 语 言 编译 专 最 终 翻 译 成 的 机 需 指 令 码 与 我 们 手工 写 汇 编 语言 所 得 到 
的 性 能 在 大 部 分 情况 下 相差 无 几 。C 语 言 基本 能 达成 我 们 对 性 能 的 要 
求 ， 而 在 某 些 对 性 能 要 求 十 分 严 苛 的 热点 (hotspot) 上 ， 我 们 可 以 对 
这 些 功能 模块 手工 编写 汇编 代码 。C 语 言 与 汇编 语言 的 ABI 是 完全 兼容 
的 ， 而 且 大 部 分 C 语 言 编译 万 还 文 持 直 接 内 联 汇 编 语 言 。 因 此 ，C 语 言 
从 1970 年 直到 现在 都 是 系统 级 编程 的 首要 编程 语言 。 


第 2 章 ”学 习 C 语 言 的 预备 知识 


我 们 在 第 1 章 已 经 大 致 介绍 了 C 语 言 的 概念 以 及 编译 、 连 接 流程 。 
我 们 知道 C 语 言 是 高 级 语言 中 比较 侦 硬 件 确 层 的 编程 语言 ， 因 此 对 于 
用 C 语 言 的 编程 人 员 而 言 ， 了 解 一 些 关 于 处 理 絮 架构 方面 的 知识 是 很 
有 必要 的 ， 对 于 藤 入 式 系统 开发 的 程序 员 而 言 更 是 如 此 了 。 


男 外 ，C 语 言 中 有 很 多 按 位 计算 以 及 逻辑 计算 ， 所 以 对 于 初学 者 
来 说 ， 如 有 果 对 整数 编码 方式 等 计算 机 基础 知识 不 熟悉 ， 那 么 对 这 些 操 
作 的 理解 也 会 变 得 十 分 困难 。 因 此 ， 本 章 将 主要 给 C 语 言 初学 者 、 同 
时 也 是 计算 机 编程 初学 者 ， 提 供 计 算 机 编程 中 会 涉及 的 基本 知识 ， 这 
样 ， 在 本 书后 面 讲解 到 一 系列 相关 概念 时 ， 初 学 者 也 不 会 感到 阳 生 。 


2.1 计算 机 体系 结构 人 简介 


图 2-1 为 一 个 简单 的 计算 机 体系 结构 图 。 


一 个 简单 的 计算 机 系统 包含 了 中 央 处 理 器 (CPU) 以 及 存储 器 和 
其 他 外 部 设备 。 而 在 CPU 内 部 则 由 计算 单元 、 通 用 目的 寄存 器 、 程 序 
序列 器 、 数 据 地 址 生成 器 等 部 件 构成 。 下 面 我 们 将 从 外 到 内 分 别 简单 


地 介绍 这 些 组 件 。 


WE 


贮存 器 (Storage) 尽管 在 图 2-1 中 没有 表示 出 来 ， 但 我 们 对 它 一 定 
不 会 陌生 ， 比 如 我 们 在 PC 上 使 用 的 硬盘 (Hard Disk) 就 是 一 种 贮存 
器 。 贮 存 器 是 一 种 存储 器 ， 不 过 它 可 用 于 持久 保存 数据 而 不 丢失 。 
此 我 们 通常 把 具有 可 持久 保存 的 存储 器 统称 为 贮存 器 。 现 在 PC 上 用 得 
比较 现代 化 的 贮存 器 就 是 SSD (Solid-State Disk) 了 ， 俗 称 固态 硬盘 。 
当然 ， 贮 存 器 束 其 存储 介质 来 说 属于 ROM (Read-Only Memory) ， 即 
只 读 存 储 器 。 这 类 存储 器 的 特点 是 数据 能 持久 保留 ， 比 如 我 们 PC 上 的 
文件 ， 即 便 在 关闭 计算 机 之 后 也 一 直 会 保存 在 你 的 硬盘 上 ， 而 且 PC 上 
的 软件 往往 也 是 以 可 执行 文件 的 形式 保存 在 硬盘 上 的 。 但 是 它 的 读 写 
速度 非常 缓慢 ， 尤 其 是 老式 的 SATA 磁 盘 ， 写 操作 则 更 慢 。 因 为 通常 对 


ROM 的 数据 修改 都 要 通过 移 读 取 某 段 数据 所 在 的 而 区 ， 然 后 对 该 数据 
进行 修改 ， 再 欣 除 所 涉及 的 局 区 ， 了 最 后 把 修改 好 的 数据 所 包含 的 耐 区 
再 写 回 去 。 而 对 于 ROM 来 说 ， 其 而 区 是 有 写 入 次 数 限 制 的 ， 所 以 写 入 
次 数 越 多 ， 损 耗 就 越 大 。 当 我 们 发 现 一 个 硬盘 访问 很 慢 的 时 候 ， 通 常 
就 是 其 局 区 (或 磁道 ) 已 经 破损 严重 了 ， 这 是 在 不 断 纠 错 并 交换 良好 
的 书 区 所 引发 的 延 退 。 在 舱 入 式 系统 中 ， 我 们 用 的 ROOM 一般 是 
EPROM、EEPROM、Flash ROM 等 。 这 些 硬件 的 详细 资料 各 位 可 以 从 
网 上 轻易 获得 ， 这 里 不 再 芍 述 。 


CPU 


ek 


) 
人 


计算 单元 
算术 逻辑 单元 
(ALU) 


数据 总 线 | 
存储 器 


(Memory) 


数据 总 线 


图 2-1 简单 的 计算 机 体系 结构 图 


2.1.2 ”存储 器 


存储 器 (Memory) 一 般 是 指 我 们 通常 所 说 的 内 存 或 主 存 (Main 
Memory) 。 其 存储 介质 属于 RAM (Random Access Memory) ， 即 随 


机 访问 存储 器 。 它 的 特点 是 访问 速度 快 ， 可 对 单个 字 节 进行 读 写 ， 这 
与 ROM 需 要 擦 除 整个 而 区 再 对 整个 看 区 写 入 的 方式 有 所 不 同 ， 因 此 更 
高 效 、 灵 活 。 但 是 RAM 的 数据 无 法 持久 化 ， 掉 电 之 后 就 会 消失 。 此 

外 ，RAM 的 成 本 也 比 ROM 高 昂 得 多 ， 我 们 对 比 一 下 16GB 的 内 存 条 与 
256GB SSD 的 价格 瓯 能 知道 。 然 而 正 因为 RAM 的 访问 速度 快 ， 并 且 离 
CPU 更 近 ， 所 以 在 许多 系统 中 都 是 将 程序 代码 与 数据 先 读 取 到 RAM 中 
之 后 再 让 CPU 去 执行 处 理 的 。 当 然 ， 在 一 些 舱 入 式 系统 中 也 有 让 CPU 
直接 执行 ROM 中 的 代码 并 访问 读 ROM 中 常量 数据 的 情况 ， 因 为 这 类 系 
统 中 总 线 频率 以 及 CPU 频率 都 相对 较 低 ， 并 且 ROM 也 是 气 CPU 以 SoC 
(System-On-Chip， 系 统 级 芯片 ， 的 方式 整合 在 一 块 芯 片上 的 ， 所 以 访 
问 成 本 要 低 很 多 。 而 有 些 环境 对 ROM 的 读 取 速度 甚至 比 读 取 RAM 还 更 
快 些 。 


Oj， 在 本 书 中 所 出 现 的 -存储 器 " 均 表 示 内 在 ， 即 RAM .而 
将 可 持久 保存 数据 的 存储 器 都 一 律 称 为 “贮存 器 *”。 了解 了 这 些 概 念 
后 ， 我 们 在 国外 网 站 购买 Mac 或 PC 时 ， 看 到 相关 的 术语 就 不 会 手足 无 
措 了 。 这 里 提供 Apple 美 国 官网 的 Mac 配 置信 息 网 页 ， 各 位 可 以 参考 : 


www.apple.com/macbook-pro/specs/ ° 


D1 他 证 


寄存 器 是 在 CPU 核心 中 的 、 用 于 和 暂 存 数据 的 存储 单元 。 一 般 处 理 
器 内 部 对 数据 的 算术 逻辑 计算 往往 都 需要 通过 寄存 器 (Register) ， 而 
不 是 直接 对 外 部 存储 全 进行 操作 。 因 此 ， 如 果 我 们 要 计算 一 个 加 法 或 
乘法 计算 ， 需 要 先 把 相关 数据 从 外 部 存储 句 读 到 处理 妖 上 自己 的 通用 目 
的 寄存 器 中 ， 然 后 对 寄存 器 做 计算 操作 ， 再 将 计算 结果 也 放 入 寄存 
饥 ， 最 后 将 结果 寄存 右 中 的 数据 再 写 入 外 部 存储 絮 。 寄 和 存 铝 的 访问 速 
度 非常 快 ， 它 是 这 三 种 存储 介质 中 速度 最 快 的 ， 但 是 数量 也 是 最 少 
的 。 像 在 传统 的 32 位 x86 处 理 器 体系 结构 下 ， 程 序 员 一 般 能 直接 用 的 通 
用 目的 寄存 器 只 有 EAX、EBX、ECX、EDX、ESI、EDI、EBP 这 7 个 。 
还 有 一 个 ESP 用 于 操作 堆栈 ， 往 往 无 法 用 来 处 理 通用 计算 。 


2.1 洒 ”计算 单元 


计算 单元 一 般 由 算术 逻辑 单元 (ALU) 、 乘 法 器 、 移 位 器 构成 。 
当然 ， 像 一 般 高 级 点 的 处 理 器 还 包含 除法 器 ， 以 及 用 于 做 浮 点 数 计算 
的 浮 点 处 理 单元 (FPU) 。 它 们 一 般 都 直接 对 寄存 器 进行 操作 。 而 涉及 
数据 读 写 的 指令 会 由 专门 的 加 载 、 存 储 处 理 单元 进行 操作 。 


2.1.5 程序 执行 流程 


处 理 需 在 执行 一 段 程 序 时 ， 通 稼 先 从 外 部 存储 器 取得 指令 ， 然 后 
对 指令 进行 译 码 处 理 ， 转 换 为 相关 的 一 系列 操作 。 这 些 操作 可 能 是 对 
寄存 器 的 算术 逻辑 运算 ， 也 可 能 是 对 存储 器 的 读 写 操作 ， 然 后 执行 相 
天 计算 。 最 后 把 计算 结 末 写 回 寄存 通 或 写 回 到 存储 器 。 不 过 处 理 句 在 
执行 一 系列 指令 的 时 候 并 不 是 每 条 指令 都 必须 先 经 过 上 面 所 描述 的 整 
个 过 程 才 能 执行 下 一 条 ， 而 是 采用 流水 线 的 方式 执行 ， 如 图 2-2 所 示 。 


图 2-2 体 现 了 一 个 简单 的 处 理 器 执行 完 一 条 指令 的 完整 过 程 。 我 们 
这 里 假设 从 第 一 个 取 指 令 阶段 到 最 后 的 写 回 阶段 ， 这 5 个 阶段 均 人 花费 1 
个 周期 ， 倘 大 不 是 采用 流水 线 的 方式 ， 而 是 每 完成 一 条 指令 的 执行 再 
执行 下 一 条 指令 ， 那 么 每 条 指令 的 处 理 都 需要 5 个 周期 。 而 一 旦 采用 流 
水 线 方 式 处 理 ， 那 么 我 们 可 以 看 到 ， 在 第 一 条 指令 执行 到 译 码 阶段 
时 ， 处 理 侨 可 以 对 第 二 条 指令 做 取 指 令 操作 ， 当 第 一 条 指令 执行 到 执 
行 阶段 时 ， 第 二 条 指令 执行 到 了 译 码 阶 段 ， 此 时 第 三 条 指令 开始 做 取 
日 令 阶段 ， 然 后 以 此 类 推 。 这 样 ， 当 整 条 流水 线 填 充满 之 后 ， 即 执行 
到 了 第 5 条 指令 ， 那 么 对 于 后 续 指 令 而 言 ， 处 理 每 一 条 指令 的 时 间 均 只 


需要 一 个 周期 


IF ID EX MEM WB 
_ 取 指 | | 译 码 | | 执行 | | 访 存 | 写 加 


输入 输出 


图 2-2 ”处 理 器 执行 流水 线 


这 里 需要 注意 的 是 ， 并 不 是 每 条 指令 都 需要 访 存 操作 ， 只 有 当 需 
要 对 外 部 存储 器 做 读 写 操作 时 才 会 动用 访 存 执行 单元 。 然 而 大 部 分 指 
令 都 需要 写 回 寄存 器 操作 ， 即 便 像 一 条 用 于 比较 大 小 的 指令 ， 或 一 条 
系统 中 断 指令 ， 它 们 也 会 影响 状态 寄存 禹 。 当 然 ， 很 多 处 理 胡 会 有 择 
操作 (NOP) 指令 ， 它 仅仅 占用 一 个 时 钟 周期 ， 而 不 会 对 除了 指令 指 
针 寄 存 右 以 外 的 任何 寄存 此 产生 影响 。 


2.2 ”整数 在 计算 机 中 的 表示 


我 们 日 常用 的 整数 都 是 十 进 制 数 (Decimal) ， 也 就 是 我 们 通常 所 
说 的 着 十 进 一 。 因 为 我 们 人 类 有 十 根 手 指 ， 所 以 目 然 而 然 地 会 想到 采 
用 十 进 制 的 计数 和 计算 方式 。 然 而 ， 现 在 几乎 所 有 计算 机 都 采用 二 进 
制 数 (Binary) 编码 方式 ， 所 以 我 们 日 常 所 用 到 的 整数 如 果 要 用 计算 机 
来 表示 的 话 ， 需 要 表示 成 二 进 制 的 方式 。 


二 进 制 数 则 是 着 二 进 一 ， 所 以 在 整 串 数 中 只 有 0 和 1 两 种 数 子 。 比 
如 ， 十 进 制 数 0， 对 应 二 进 制 为 0， 十 进 制 数 1!， 对 应 二 进 制 数 1， 十 进 
制 数 2， 对 应 二 进 制 数 10;， 十进制 数 3， 对 应 二 进 制 数 11。 因此， 对 于 
非 负 整数 而 言 ， 二 进 制 数 第 n 位 (n 从 0 开始 计 ) 如 果 是 1， 那 么 就 对 应 
十 进 制 数 的 22?， 然 后 每 个 位 计算 得 到 的 十 进 制 数 再 依次 相 加 得 到 最 终 十 
进 制 数 的 值 。 比 如 ， 一 个 5 位 二 进 制 数 10010， 最 低位 为 最 右边 的 位 ， 
记 为 0 号 位 ， 数 值 为 0， 最 高 位 为 最 左边 的 位 ， 记 为 4 号 位 ， 数 值 为 1 。 
那么 它 所 对 应 的 十 进 制 数 为 ，24+21=18。 因 为 该 二 进 制 数 除了 4 号 位 和 1 
号 位 为 1 之 外 ， 其 余 位 都 是 9， 因此 0 乘 以 ?肯定 为 0° 图 2-3 为 二 进 制 数 
10010 换 算 成 十 进 制 数 的 方法 图 。 


bit 4 bit 3 bit 2 bit ] bit 0 
1 2 0 OQ% 2 1 2 Qx 2 
二 进 制 数 10010 对 应 的 十 进 制 数值 为 : 
1 x2?+0Xx23+0Xx22+1Xx2H0Xx20=18 
图 2-3 5 位 二 进 制 数 对 应 十 进 制 的 计算 


在 计算 机 术语 中 ， 把 二 进 制 数 中 的 某 一 位 数 义 称 为 一 个 比特 

(bit) 。 比 特 这 个 单位 对 于 计算 机 而 言 ， 在 度量 上 是 最 小 的 单位 。 除 
了 比特 之 外 ， 还 有 字 节 (byte) 这 个 术语 。 一 个 字 厄 由 8 个 比特 构成 。 
在 某 些 单 族 机 架构 下 还 引入 了 半 字 节 (nybble 或 nibble) 这 个 概念 ， 表 
示 4 个 比特 。 然 后 ， 还 有 字 (word) 这 个 术语 。 字 在 不 同 计算 机 架构 下 
表示 的 舍 义 不 同 。 在 x86 以 构 下 ， 一 个 字 为 2 个 字 节 ;而 在 ARM 等 众多 
32 位 RISC 体 系 结构 下 ， 一 个 字 表 示 为 4 个 字 方 。 随 着 计算 机 市 曙 的 提 
升 ， 能 被 处 理 句 一 次 处 理 的 数据 宽度 也 不 断 提 升 ， 因 此 出 现 了 双 字 

(double word) 、 四 字 (guad word) 、 八 字 (octa word) 等 概念 。 双 
字 的 宽度 为 2 个 字 ， 四 字 宽 度 为 4 个 字 ， 所 以 它们 在 不 同 处 理 器 体系 结 
构 下 所 占用 的 字 和 个 数 也 会 不 同 。 


我 们 上 面 介绍 了 非 负 整 数 的 二 进 制 表达 方法 ， 那 么 对 于 负数 ， 二 
进 制 又 该 如 何 表达 呢 ? 在 计算 机 中 有 原 码 和 补 码 两 种 表示 方法 ， 而 最 
为 间 用 的 十 补 码 的 表示 方法 。 下 面 我 们 分 别 对 原 码 和 补 码 进行 介绍 。 


2.2.1 原 码 表示 法 


对 于 无 正 负 符号 的 原 码 ， 其 二 进 制 表达 如 上 节 所 述 。 而 对 于 含有 
正 负 符 号 的 原 码 ， 其 二 进 制 表示 侣 有 一 位 符号 位 ， 用 于 表示 正 负 号 。 
一 般 都 是 以 二 进 制 数 的 最 高 有 效 位 〈《 即 最 左边 的 比特 ) 作为 符号 位 ， 
其 余 各 位 比特 表示 该 数 的 绝对 值 大 小 。 比 如 ， 十 进 制 数 6 用 一 个 8 位 的 
原 码 表示 为 00000110; 如 果 是 -6， 则 表示 为 10000110。 二 进 制 的 原 码 表 
示 不 例如 图 2-4 所 示 。 


bi7 Dee6 tS Ot D3 Wt2 mtl Wt0 
sist [oT oT oTo lol Tr To | 
符号 位 数值 数值 数值 数值 数值 数值 ”数值 
对 应 十 进 制 数 为 :+6 
Bt7 Wite Bts bta4 Bt Bt2 Btl It 
ast [ ToT oTo lolr Tr To | 
符号 位 数值 数值 数值 数值 数值 数值 ”数值 
对 应 十 进 制 数 为 : -6 


图 2-4 二进制 数 的 原 码 表示 


原 码 的 表示 非常 直观 ， 但 是 对 于 计算 机 算术 运算 而 言 就 带 来 了 许 
多 麻烦 。 比 如 ， 我 们 用 上 述 的 6 与 -6 相 加 ， 即 00000110+10000110， 结 
为 10001100， 世 就 是 十 进 制 数 -12， 显 然 不 是 我 们 想 要 的 结果 。 所 以 ， 
如 果 某 个 处 理 器 用 原 码 表 示 二 进 制 数 ， 那 么 它 参 与 加 减法 的 时 候 必须 


对 两 个 操作 数 的 正 负 符号 加 以 判断 ， 然 后 再 判定 使 用 加 法 操作 还 十 减 
法 操作 ， 最 后 还 要 判定 结 采 的 正 负 符号 ， 可 谓 相 当 麻 烦 。 所 以 ， 当 前 
计算 机 的 处 理 紫 往往 采用 补 码 的 方式 来 表达 市 符号 的 二 进 制 数 。 


22.2 汀 码 表示 法 


正 由 于 原 码 舍 有 上 述 忠 操 ， 所 以 人 们 开发 出 了 为 一 种 市 符号 的 二 
进 制 码 表 示 法 一 一 补 码 。 补 码 与 原 码 一 样 ， 用 最 高 位 比特 表示 符号 
位 ， 其 余 各 位 比特 则 表示 数值 大 小 。 如 果 符 号 位 为 0， 说 明 整 个 二 进 制 
数 为 正 数 或 零 ， 如 琳 为 1， 那 么 表示 整个 二 进 制 数 为 负数 。 当 符号 位 为 
0 时 ， 二 进 制 补 码 表示 法 与 原 码 一 模 一 样 ， 但 是 当 符号 位 为 负数 时 ， 情 
况 就 完全 不 同 了 。 此 时 ， 对 二 进 制 数 的 补 码 表示 需要 按 以 下 步骤 进 


行 : 


1) 先 将 该 二 进 制 数 以 绝对 值 的 原 码 形式 写 好 ; 


2) 对 整个 二 进 制 数 (包括 符号 位 ) ， 每 一 个 比特 都 了 到 反 。 所 谓 取 
反 束 是 说 ， 原 来 一 个 比特 的 数值 为 0 时 ， 则 要 变 1;， 为 1 时 ， 则 要 变 0。 


变换 好 之 后 ， 将 二 进 制 数 做 加 1 计算 ， 最终 结果 就 是 该 负数 的 补 码 
住 ] 


下 面 我 们 还 是 用 6 来 举例 ，+6 的 二 进 制 补 码 跟 原 码 一 样 ， 还 是 
00000110。 而 -6 的 计算 过 程 ， 按 照 上 述 流 程 如 下 : 


1) 先 将 -6 用 绝对 值 +6 的 形式 表示 : 00000110; 


2) 对 每 个 比特 位 取 反 ， 包 括 符 号 位 在 内 ， 得 到 : 11111001; 


3) 将 变换 好 的 数 做 加 1 计算 ， 最 终 得 到 : 11111010。 


由 于 二 进 制 补 码 的 表示 与 通常 我 们 可 直接 读 懂 的 二 进 制 数 的 表示 
有 很 大 不 同 ， 所 以 给 定 一 个 二 进 制 补 码 ， 我 们 往往 需要 先 获 得 其 绝对 
值 大 小 才能 知道 它 的 具体 数值 。 获 得 其 绝对 值 的 过 程 为 ， 先 判定 符号 
位 ， 如 果 符 号 位 为 0， 那 么 就 以 通常 的 二 进 制 数 表示 法 来 读 即 可 。 如 果 
符号 位 为 1， 那 么 就 以 上 述 同 样 的 过 程 得 到 其 对 应 的 绝对 值 。 比 如 ， 如 
果 给 定 11111010 这 个 二 进 制 数 ， 我 们 看 到 最 高 位 符号 位 为 1， 说 明 是 负 
数 ， 我 们 就 以 上 述 过 程 来 求解 : 


1) 先 将 该 二 进 制 数 每 个 比特 做 取 反 计算 ， 得 到 : 00000101; 


2) 然后 将 变换 得 到 的 值 做 加 1 计算 ， 最 终 获得 : 00000110 。 


所 以 11111010 的 绝对 值 为 00000110， 即 6。 


对 于 补 码 表示 ， 我 们 已 经 知道 最 高 位 比特 表示 符号 位 ， 其 余 的 表 
示 具 体 数值 。 但 是 这 里 有 一 个 特殊 情况 ， 即 符号 位 为 1， 其 余 位 比特 为 


都 为 0 的 情况 。 比 如 一 个 8 位 二 进 制 补 码 : 10000000， 此 时 它 的 值 是 多 
少 ? 因为 我 们 通过 上 述 流程 ， 求 得 其 绝对 值 的 大 小 也 是 10000000， 所 
以 当前 大 部 分 计算 机 处 理 器 的 实现 将 它 作 为 -128， 但 估计 仍然 有 一 些 处 
理 妖 会 把 它 作 为 -0。 因 为 C 语 言 标准 中 对 于 数值 范围 的 表示 已 经 明确 表 
示 出 8 位 带 符号 的 整数 范围 可 以 是 -128 到 +127， 也 可 以 是 -127 到 +127， 
但 最 小 值 不 得 大 于 -127， 最 大 值 不 得 小 于 +127。 第 5 革 会 有 更 详细 的 描 


了 述 。 


补 码 的 这 种 表示 法 的 优点 就 是 可 以 无 视 符号 位 ， 随 意 进 行 算术 运 
算 操 作 。 比 如 ， 像 我 们 上 面 所 举 的 例子 : 6+ (-6) ， 计 算 结果 : 


00000110+11111010=00000000 


最 后 ， 上 壕 计算 结果 的 最 高 位 符号 位 所 产生 的 进位 被 丢弃 (在 处 
理 器 中 可 能 会 设置 相应 的 进位 标志 位 ) 。 我 们 自己 计算 的 话 也 非常 方 
便 ， 在 计算 过 程 中 ， 无 需 关 心 两 个 二 进 制 补 码 的 正 负 数 的 情况 ， 也 无 
需 关 心 符 号 位 所 产生 的 影响 。 我 们 只 需要 像 计 算 普 通 二 进 制 数 一 样 去 
计算 即 可 。 把 最 终 的 计算 结果 拿 出 来 判断 ， 有 是 正 数 还 是 负数 。 当 然 ， 
二 进 制 补 码 会 产生 溢出 情况 ， 比 如 两 个 8 位 二 进 制 补 码 加 法 : 


120+50=01111000+00110010=10101010 


然而 ， 这 个 数 并 不 是 170， 而 是 -86。 首 先 ，170 已 经 超出 了 带 符号 8 
位 二 进 制 数 可 表示 的 最 大 范围 了 ; 其 次 ， 最 高 位 变 为 1， 用 补 码 表 示 来 


讲 束 是 负数 表示 形式 。 所 以 ， 这 两 个 正 数 的 加 法 计算 就 产生 了 负数 结 
果 ， 这 种 现象 称 为 上 淤 。 如 有 果 我 们 要 避免 在 计算 过 程 中 出 现 上 深情 
况 ， 需 要 用 更 高 位 宽 的 二 进 制 数 来 表示 ， 以 提升 精度 。 比 如 ， 如 果 我 
们 将 上 述 加 法 用 16 位 二 进 制 数 表 示 ， 那 么 吏 不 会 有 上 盗 问 题 了 。 


另外 ， 在 C 语 言 标准 中 没有 明确 规定 C 语 言 编译 万 的 实现 以 及 运行 
时 环境 必须 采用 哪 种 二 进 制 编码 方式 ， 而 十 对 整数 类 型 标明 最 大 可 表 
示 的 数值 范围 。 目 前 大 部 分 C 语 言 实 现 都 是 对 带 符 号 整数 采用 补 码 的 表 


示 方 式 。 这 些 会 在 第 5 章 做 进一步 讲解 。 


2.2.3 ”八进制 数 与 十 六 进 制 数 


上 面 我 们 对 二 进 制 数 编码 形式 做 了 比较 详细 的 介绍 。 我 们 在 编写 
程序 或 者 查看 一 些 计 算 机 相关 的 技术 文档 时 常常 还 会 磁 到 八进制 数 与 
十 六 进 制 数 的 表示 ， 万 其 是 十 六 进 制 效用 得 非常 多 。 下 面 我 们 束 商 单 
介绍 一 下 这 两 种 基数 (radix) 的 表示 方法 。 


这 里 跟 各 位 再 分 享 一 个 术语 一 一 基数 。 基 数 也 就 是 我 们 通常 所 说 
的 ， 某 一 个 数 用 多 少 进 制 表达 。 对 于 像 "01001000 是 几 进 制 数 ”这 种 
话 ， 如 果 用 更 专业 的 表达 方式 来 说 的 话 就 是 ，“01001000 的 基数 是 
几 ”。 基 数 为 2 束 古 二 进 制 ， 基 数 为 10 则 是 十 进 制 。 


八进制 数 是 逢 八 进 一 ， 因 此 每 位 数 的 范围 是 从 0 一 7。 八 进 制 数 转 
十 进 制 数 也 很 商 单 ， 我 们 可 以 用 二 进 制 数 转 十 进 制 数 类 似 的 方法 来 炮 
制 八 进 制 数 转 十 进 制 数 一 一 以 一 个 八进制 数 每 位 数值 作为 系数 ， 然 后 
乘 以 8?， 然 后 计算 得 到 的 结 末 全 都 相 加 ， 最 后 得 到 相应 的 十 进 制 数 。 其 
中 ，n 表 示 当 前 该 位 所 对 应 的 位 置 索引 (同样 以 0 开始 计 ) 。 比 如 ， 八 
进 制 数 5271 对 应 的 十 进 制 数 的 计算 过 程 如 图 2-5 所 示 。 


位 3 位 2 位 1 位 0 
83 %2 8 ] 80 


最 终 十 进 制 数 的 结果 : 5 x 83+2 x 82+7 x 8I+1 x 8%+=2745 
图 2-5 “八进制 数 转 十 进 制 数 


八进制 数 对 应 于 二 进 制 数 的 话 正 好 占用 3 个 比特 “范围 从 000~ 
111) ， 一 般 在 通信 和 领域 以 及 信息 加 密 等 领域 会 用 到 八进制 编码 方式 。 
而 十 六 进 制 数 比 八进制 数 用 得 更 多 ， 因 为 十 六 进 制 数 正好 占用 4 个 比 
特 ， 即 4 位 二 进 制 数 《范围 从 0000~1111) 。4 个 比特 相当 于 半 个 字 
节 。 所 以 ， 无 论 是 开发 工具 还 是 程序 调试 工具 ， 一 般 都 会 用 十 六 进 制 
数 来 表示 计算 机 内 部 的 二 进 制 数据 ， 这 样 更 易 读 ， 而 且 也 更 省 显示 空 
间 (因为 一 个 字 节 原本 需要 8 位 二 进 制 数 ， 而 十 六 进 制 数 只 要 两 位 即 可 
表示 ) 。 下 面 就 介绍 一 下 十 六 机 制 数 的 表示 方法 。 


十 六 进 制 数 逢 十 六 进 一 ， 因 此 每 一 位 数 的 范围 是 从 0 到 15。 由 于 我 
们 通常 在 数学 上 所 用 的 十 进 制 数 无 法 用 一 位 来 表示 10~15 这 6 个 数 ， 
而 在 计算 机 领域 中 ， 我 们 通常 用 英文 字母 A (或 小 写 a) 来 表示 10; B 
(或 小 写 b) 来 表示 11; C (或 小 写 c) 来 表示 12; D (或 小 写 d) 来 表示 
13; EE (或 小 写 e) 来 表示 14; F (或 小 写 f) 来 表示 15。 十 六 机 制 数 转 
十 进 制 数 的 方式 与 八进制 数 转 十 进 制 数 类 似 一 一 以 一 个 十 六 进 制 数 每 
位 数值 作为 系数 ， 然 后 乘 以 16*?， 然 后 计算 得 到 的 结果 全 都 相 加 ， 最 后 
得 到 相应 的 十 进 制 数 。 其 中 ，n 表 示 当 前 位 所 对 应 的 位 置 索 引 (同样 以 
0 开始 计 ) 。 比 如 ， 一 个 4 位 十 六 进 制 数 CODE 的 计算 过 程 如 图 2-6 所 示 : 


位 3 位 2 位 1 位 0 
| clo |p |s, 
1 63 16” Lr 16 


最 终 十 进 制 数 的 结果 : 12 x 163+0 x 162+13 x 16!+14 x 160+=49 374 
图 2-6 十 六 进 制 数 转 十 进 制 数 


上 述 4 位 十 六 进 制 数 CODE， 倘 车 用 二 进 制 数 表示 ， 则 为 : 
1100000011011110。 可 见 ， 用 十 六 进 制 数 表示 要 简洁 得 多 ， 而 且 换 算 成 
十 进 制 数 也 相对 比较 容易 ， 尤 其 对 于 一 个 字 节 长 度 的 整数 来 说 。 为 了 
能 更 快速 地 换算 二 进 制 数 、 十 进 制 数 与 十 六 进 制 数 ， 请 各 位 读者 务必 
熟 记 下 表 : 


表 2-1 ”二进制 数 、 十 进 制 数 与 十 六 进 制 数 的 换算 表 


习惯 上 ， 用 0 或 0o0 打 头 的 数 表 示 八 进 制 数 ，0x 打 头 的 数 表 示 十 六 
制 数 。 比 如 ，0123、0777 表 示 八 进 制 数 ，0x123，0xABCD 表 示 十 六 


制 数 。 


三 进 制 数 十 六 进 制 数 
0000 | 0 
0001 1 
0010 2 
0011 3 
0100 4 
0101 5 
on10 6 6 
ol 7 
1000 | 3 
1001 | 9 | 9 
1010 A 
1011 B 
1100 C 
1101 D 
1110 14 E 
1111 13 F 


沸 


和 


2.3 浮上 总 数 在 计算 机 中 的 表示 


当前 主流 处 理 器 一 般 都 能 支持 32 位 的 单 精度 浮 点 数 与 64 位 的 双 精 
度 浮 点 数 的 表示 和 计算 ， 并 且 能 遵循 IEEE754-1985 工 业 标 准 。 现 在 此 
标准 最 新 的 版 本 是 2008， 其 中 增加 了 对 16 位 半 精 度 浮 点 数 以 及 128 位 四 
精度 浮 点 数 的 描述 。C 语 言 标准 引入 了 一 个 浮 点 模型 ， 可 用 来 表达 任意 
精度 的 浮 点 数 ， 尽 管 当 前 主流 C 语 言 编译 器 尚未 很 好 地 支持 半 精 度 浮 点 
数 与 四 精度 浮 点 数 的 表示 和 计算 。 关 于 C 语 言 标准 对 浮 点 数 的 描述 ， 我 
们 稍 后 将 在 5.2 节 做 更 详细 的 介绍 。 


为 了 更 好 地 理解 IEEE754-1985 中 规格 化 (normalized) 浮 点 数 的 表 
示 法 ， 我 们 移 来 介绍 一 下 浮 点 数 用 一 般 二 进 制 数 的 表示 方法 。 一 个 浮 
点 数 包 含 了 整数 部 分 和 尾数 〈《 即 小 数 ) 部 分 。 整 数 部 分 的 表示 与 我 们 
之 前 所 讨论 过 的 一 样 ， 第 n 位 就 表示 22，n 从 0 开始 计 。 而 尾数 部 分 则 是 
第 mm 位 表示 2 也 ，m 从 1 开始 计 。 对 于 一 个 0101.1010 的 二 进 制 浮 点 数 对 应 
十 进 制 数 的 计算 如 图 2-7 所 示 : 


整 3 位 ” 整 2? 位 整 1 位 ” 整 0 位 尾 1 位 ” 尾 2 位 ” 尾 3 位 ” 尾 4 位 
[Wm | | | | | | | | | 
)3 D2 所 ?0 ?-1 =-2 -3 p 


一 一 一 二 一 < < < 


十 进 制 数 结果 为 ; 


| x 2°+0x2'+1 x2:+0x 23+1 X24+0X27?+1 x23+0x 24=5.625 


图 2-7 二 进 制 浮 点 数 转 十 进 制 数 


图 2-7 中 ， 整 :位 即 表示 第 i 位 整数 ， 尾 i 位 即 表 示 第 i 位 尾数 。 其 中 ， 
第 3 位 整数 为 最 高 位 整数 ， 第 4 位 尾数 表示 最 低位 尾数 。 对 二 进 制 浮 点 
数 的 表示 有 了 概念 之 后 ， 我 们 就 可 以 看 IEEE754-1985 标 准 中 对 规格 化 
浮 点 数 的 描述 了 。IEEE754-1985 对 32 位 单 精 度 与 64 位 双 精 度 两 种 精度 
的 浮 点 数 进 行 描述 。32 位 单 精 度 浮 点 可 表示 的 数值 范围 在 +1.18x10-38 到 
+3.4x1038， 大 约 舍 有 7 位 十 进 制 有 效 数 ; 64 位 双 精 度 浮 点 可 表示 的 数值 
范围 在 +2.23x10-305 到 +1.80x10305， 大 约 舍 有 15 位 十 进 制 有 效 数 。 我 们 
看 到 IEEE 定 义 的 浮 点 数 的 绝对 值 范围 可 以 是 一 个 远大 于 1 的 数 ， 也 可 以 
是 一 个 大 于 零 但 远 小 于 1 的 数 ， 即 它 的 小 数 精度 是 可 浮动 的 ， 所 以 称 
为 浮 点 数 。 如 果 说 是 定点 数 的 话 ， 它 也 可 表示 一 个 小 数 ， 但 是 其 整数 
位 数 与 小 数位 数 的 精度 都 是 固定 的 。 比 如 一 个 16.16 的 定点 数 表示 整数 
部 分 采用 16 个 比特 ， 尾 数 部 分 也 采用 16 个 比特 。 而 对 于 一 个 32 位 浮 点 
数 来 说 ， 既 能 使 用 16.16 的 格式 ， 也 能 使 用 30.2 的 格式 ( 即 30 个 比特 表 
示 整 数 ，2 个 比特 表示 尾数 ) 或 其 他 各 种 形式 。 而 IEEE754-1985 对 规格 
化 单 精 度 浮 点 数 的 格式 如 下 定义 : 


1) 1 位 符号 位 ， 一 般 是 最 高 位 〈31 位 ) ， 表 示 正 负 号 。0 表 示 正 
数 ，1 表 示人 负数 。 


2) 8 位 指数 位 ， 又 称 阶 码 ， 位 于 23 到 30 位 。 ( 阶 码 的 计算 后 面 会 


详细 介绍 。) 


3) 23 位 尾数 ， 位 于 0 到 22 位 。 


我 们 下 面 举 一 个 实际 的 例子 来 详细 说 明 一 个 十 进 制 小 数 5.625 如 何 
表示 成 IEEE754 标 准 的 规格 化 32 位 单 精 度 浮 点 数 。 


1) 5.625 是 一 个 正 数 ， 所 以 符号 位 为 0， 即 第 31 位 为 0。 


2) 我 们 将 5.625 依 照 图 2-7 那 样 写成 一 般 小 数 的 表示 法 
0101.101。 


3) 我 们 将 此 二 进 制 浮 点 数 用 科学 计数 法 来 表示 ， 使 得 二 进 制 整数 
位 为 最 高 位 的 1。 这 里 最 高 位 为 1 的 比特 是 从 左 往 右 数 是 第 二 个 比特 ， 
所 以 将 小 数 点 束 放 到 该 比特 的 后 面 ， 得 到 1.01101x2“。 二 进 制 数 的 科学 
记 数 法 ， 故 数 的 值 显然 束 是 2。 


4) 此 时 ， 我 们 能 看 到 尾数 部 分 是 小 数 点 后 面 的 那 串 二 进 制 数 ， 即 
01101， 而 指数 为 2。 现 在 我 们 来 求 阶 码 。 阶 码 用 的 是 中 经 指数 偏差 
(exponent bias) 处 理 后 的 指数 ， 即 用 上 述 得 到 的 指数 加 上 偏差 值 所 求 
得 的 和 。IEEE754 在 单 精度 浮 点 中 规定 ， 偏 差 值 为 1227。 所 以 本 例 中 ， 
阶 码 部 分 为 2+127=129， 用 二 进 制 数 表 示 就 是 10000001 。 


5) 尾数 部 分 从 大 到 小 照抄 ， 低 位 的 用 0 填充 即 可 ， 所 以 这 里 的 尾 
数 部 分 二 进 制 数 为 : 01101000000000000000000 。 


6) 将 整个 处 理 完 的 二 进 制 数 串 起 来 获得 :0 (符号 位 ) 10000001 
( 阶 码 ) 01101000000000000000000 (尾数 ) ， 用 十 六 进 制 数 表达 就 


是 : 40B40000 。 


十 进 制 小 数 转 64 位 双 精 度 浮 点 数 的 方法 与 上 述 雷 同 ， 只 不 过 阶 码 
用 11 位 比特 来 表示 ， 尾 数 则 用 52 位 比特 表示 ， 而 偏差 值 则 规定 为 
1023。 


2.4 ”地址 与 字 节 对 齐 


由 于 C 语 言 是 一 门 接近 的 层 人 硬件 的 编程 语言 ， 它 能 直接 对 存储 紫 地 
址 进行 访问 (当前 大 部 分 处 理 絮 在 操作 系统 的 应 用 层 所 访问 到 的 逻辑 
地 址 ， 而 部 分 嵌入 式 系统 由 于 不 台 市 存储 融 管 理 单元 ， 因 此 可 直接 访 
问 物理 地 址 ) 。 在 计算 机 中 ， 所 谓 “ 地 址 ? 融 是 用 来 标识 存储 单元 的 一 
个 编号 ， 束 好 比 我 们 住房 的 门牌 号 。 没 有 门牌 号 ， 快 递 殉 没 法 发 货 ; 
如 琳 | 门 牌号 记 错 了 ， 那 么 快递 束 会 把 货物 送 错 地 方 。 计 算 机 中 的 地 址 
也 是 一 样 ， 我 们 为 了 要 访问 存储 器 中 特定 单元 的 一 个 数据 ， 那 么 我 们 
目 先 要 获悉 该 数据 所 在 的 地 址 ， 然 后 我 们 通过 这 个 地 址 来 访问 它 。 访 
问 存 储 器 ， 我 们 也 简称 为 “ 访 存 ”(Memory Access) 。 访 问 地 址 ， 我 们 
也 简称 为 “ 寻 址 ”(Addressing) 。 我 们 在 图 2-1 中 也 看 到 ， 一 般 计算 机 架 
构 中 都 会 有 地 址 总 线 和 数据 总 线 。CPU 爷 通过 地 址 总 线 发 送 寻 址 信 
号 ， 以 指定 所 要 访问 存储 器 单元 的 地 址 。 然 后 再 通过 数据 总 线 向 该 地 
址 读 写 数据 ， 这 样 束 完成 了 一 次 访 存 操作 。 这 好 比 于 快递 送 货 ， 我 们 
先 打 电话 告诉 快递 通信 地 址 ， 然 后 快递 员 把 货 送 到 该 地 址 ( 写 数 
据 ) ， 或 者 去 该 地 址 拿 货 〈 读 数据) 送 到 别家 。 


一 般 对 于 32 位 系统 来 说 ， 处 理 器 一 次 可 访问 1 个 (8 比特 ， 字 方 、2 
个 了 让 或 4 个 字 证 。 当 访问 单个 字 市 时 ， 对 CPU 不 做 对 齐 限 制 ， 而 当 访 
问 多 个 字 市 时 ， 比 如 要 访问 N 个 字 证 ， 由 于 计算 机 忌 线 设计 等 诸多 因 


素 ， 要 求 CPU 所 访问 的 起 始 地 址 满足 N 个 字 市 的 倍数 来 访问 存储 器 。 如 
果 在 访问 存储 紫 时 没有 按照 特定 要 求 做 子 太 对 章 ， 那 么 可 能 会 引发 访 
存 性 能 问题 ， 甚 至 直接 导致 寻 址 错误 而 引发 异常 (引发 异常 后 通常 会 
导致 当前 应 用 意外 退出 ， 在 嵌入 式 系统 中 可 能 就 直接 死机 或 复位 ) 。 


下 面 我 们 给 出 一 张 图 2-8 来 描述 ， 看 看 一 般 对 32 位 系统 而 言 如 何 正 
确 地 做 到 访 存 字 甩 对齐 。 


图 2-8 展 示 了 如 何 正确 对 齐 访问 1 个 字 节 、2 个 字 节 和 4 个 字 节 的 情 
况 。 图 中 画 出 了 6 个 存储 单元 内 容 ， 地 址 低 16 位 从 0x1000 到 0x1005， 
个 存储 单元 为 1 个 字 节 。 对 于 仅 访 问 1 个 字 节 的 情况 ， 图 2-8 所 有 地 址 都 
能 直接 访问 并 满足 字 节 对 齐 的 情况 。 对 于 一 次 访问 2 个 字 节 的 情况 ， 要 
满足 对 齐 要 求 ， 只 能 访问 0x1000、0x1002、0x1004 等 必须 要 能 被 2 整除 
的 地 址 。 对 于 一 次 访问 4 字 市 的 情况 ， 要 满足 对 齐 要 求 ， 则 只 能 访问 
0x1000、0x1004 等 必须 要 能 被 4 整除 的 地 址 。 


Ar + 


字 池 5 字 字 4 字 3 字 字 2 字 广 1 字 字 0 


| 0x06 ] 0x05 Ox04 Ox03 ] 0x02 ] Ox01 ] 


0x1005 0x1004 0x1003 0x1002 0x1001 0x1000 ”地址 


图 2-8 字 和 对 齐 


然而 ， 并 不 古 说 要 访问 多 少子 三 ， 束 必须 要 保证 访问 能 修 多 少 整 
除 的 地 址 才能 满足 对 齐 要 求 。 如 琳 一 次 访问 8 子 方 ， 对 于 32 位 系统 
言 ， 通 过 32 位 通用 目的 寄存 能 来 读 写 存储 此 的 话 ， 某 些 CPU 会 目 动 将 8 
字 术 的 访 存 分 为 两 次 进行 操作 ， 每 次 为 4 子 廊 ， 因 此 只 要 保证 4 子 证 对 
齐 束 能 满足 对 齐 要 求 。 这 些 者 根据 特定 的 处 理 右 来 做 具体 处 理 。 


就 笔者 用 过 的 一 些 处 理 器 而 言 ， 像 x86、ARM 等 处 理 器 ， 当 访 存 不 
满足 对 齐 要 求 时 并 不 会 引发 总 线 异 常 ， 但 是 访问 性 能 会 降低 很 多 。 
为 原本 可 一 次 通信 的 数据 传输 可 能 需要 拆 分 为 多 次 ， 并 且 前 后 还 要 保 
证 数据 的 一 致 性 ， 所 以 还 可 能 会 有 锁 步 之 类 的 操作 。 而 像 Blackfin DSP 
则 会 直接 引发 总 线 异 常 ， 导 致 整个 系统 的 月 演 (如 果 不 对 此 异常 做 处 
理 的 话 ) 。 另 外 ， 像 ARMV5 或 更 低 版 本 的 处 理 器 ， 在 对 非 对 齐 的 存储 
妖 地 址 进行 访问 时 ，CPU 会 完 自 动向 下 定位 到 对 齐 地 址 ， 然 后 通过 向 
右 人 循环 移 位 的 方式 处 理 数据 ， 这 束 使 得 传输 数据 并 不 是 原本 想 一 次 传 
输 的 数据 内 容 ， 也 就 是 说 写 入 的 或 恋 出 的 数据 是 失真 的 。 比 如 ， 根 据 
图 2-8 所 示 内 容 ， 如 果 我 们 要 对 一 款 ARM7EJ-S 处 理 器 (ARMV5TEJ 架 
构 ) 从 地 址 0x1002 读 4 字 节 内 容 ， 那 么 实际 获取 到 的 数据 为 
0x02010403; 而 在 x86 架 构 或 ARMv7 架 构 的 处 理 器 下 ， 则 能 获得 


UX06050403。 


2.5 ”字符 编码 


我 们 从 2.2 市 到 2.4 市 讲述 的 都 是 数值 信息 (整数 与 浮 点 数 ) ， 本 小 
节 我 们 将 讨论 字符 信息 。 在 计算 机 中 我 们 所 处 理 的 字符 信息 ， 即 文本 
信息 (包括 数字 、 字 母 、 文 字 、 标 点 符号 等 ;是 以 一 种 特定 编码 格式 
来 定义 的 。 为 了 使 世界 各 国 的 文本 信息 能 够 通用 ， 束 需要 对 字符 编码 
做 标准 化 。 我 们 现在 最 常用 也 最 基本 的 字符 编码 系统 是 ASCII 码 
(American Standard Code for Information Interchange， 美 国信 息 交 换 标 
准 码 ) 。ASCII 码 定义 每 个 字符 仅 占 一 个 字 节 ， 可 表示 阿拉 伯 数 字 0~ 
9、26 个 大 小 写 英 文字 母 ， 以 及 我 们 现在 在 标准 键盘 上 能 看 到 的 所 有 标 
点 符号 、 一 些 控 制 字符 (比如 换行 、 回 车 、 换 页 、 振 铃 等 。ASCII 
码 最 高 位 是 奇偶 校 验 位 ， 用 于 通信 校 验 ， 所 以 真正 有 编码 意义 的 是 低 7 
个 比特 ， 因 此 只 能 用 于 表示 128 个 字符 〈 值 从 0 全 127) 。 由 于 ASCII 是 
美国 国家 标准 ， 所 以 后 来 国际 化 标准 组 织 将 它 进 行 国际 标准 化 ， 定 义 
为 了 ISO/IEC 646 标 准 。 两 者 所 定义 的 内 容 是 等 价 的 。 


ISO/IEC 646 对 于 英文 系 国 家 而 言 是 基本 够 用 了 ， 但 是 对 于 拉丁 语 
系 、 希 腊 等 国家 来 说 就 不 够 用 了 。 所 以 后 来 I SO 组 织 就 把 原先 ISO/IEC 
646 所 定义 字符 的 最 高 位 也 用 上 了 ， 这 样 承 又 能 增加 128 个 不 同 的 字 
和 从， 发 布 了 ISO/IEC 8859 标 准 。 然 而 ， 欧 洲 大 陆 虽 小 ， 但 国家 却 有 数 
百 个 ，128 种 扩展 字符 仍然 不 够 用 。 因 此 后 来 就 在 8859 的 基础 上 ， 引 入 


了 8859-n，n 从 1~16， 每 一 种 都 文 持 了 一 定数 量 的 不 同 的 字母 ， 这 样 
基本 能 满足 欧美 国家 的 文字 表示 需求 。 当 然 ， 有 些 国家 之 间 仍 然 需 要 
切换 编码 格式 ， 比 如 ISO/IEC8859-1 的 语言 环境 看 8859-2 的 就 可 能 显示 
乱码 ， 所 以 ， 还 得 切换 到 8859-2 的 字符 编码 格式 下 才能 正常 显示 。 


而 在 中 国 大 陆 ， 我 们 自己 也 定义 了 一 套用 于 显示 简体 中 文 的 字符 
集 一 一 GB2312。 它 在 1981 年 5 月 1 日 开始 实施 ， 是 中 国 国 家 标准 的 简体 
中 文字 符 集 ， 全 称 为 《信息 交换 用 汉字 编码 字符 集 . 基 本 集 》。 它 收录 
了 6763 个 汉字 ， 包 括 拉丁 字母 、 希 腊 字 母 、 日 语 假 名 、 俄 语 和 蒙古 语 
用 的 西里 尔 字 母 在 内 的 682 个 全 角 字 符 。 然 后 又 出 现 了 GBK 字 符 集 ， 
GBK1.0 收 孙 了 21886 个 符号 ， 其 中 汉字 就 包含 了 21003 个 。GBK 字 符 集 
主要 扩展 了 繁体 中 文字 。 由 于 像 GB2312 与 GBK 能 表示 成 千 上 万 种 字 
符 ， 因 此 这 已 经 远 超 1 个 字 节 所 能 表示 的 范围 。 它 们 所 采用 的 是 动态 


变 


长 字 和 编码 ， 并 且 与 ASCII 码 兼容 。 如 果 表 示 ASCII 友 部分， 那么 仅 1 
个 字 节 即 可 ， 并 且 该 字 节 最 高 位 为 0°。 如 果 要 表示 汉字 等 扩展 字符 ， 那 


么 头 1 个 字 市 的 最 高 位 为 1， 然 后 再 增加 一 个 字 市 ( 即 用 两 个 字 节 ) 进 
行 表示 。 所 以 ， 理 论 上 ， 除 了 第 1 个 字 市 的 最 蜗 位 不 能 动 之 外 ， 其 余 比 


特 都 能 表示 具体 的 字符 信息 ， 因 而 最 多 可 表示 2“+2>=32896 种 字符 。 


当然 ， 正 由 于 GB2312 与 GBK 主 要 用 于 亚洲 国家 ， 所 以 当 欧 美国 家 
的 人 看 到 这 些 字符 信息 时 显示 的 是 乱码 ， 他 们 必须 切换 到 相应 的 汉字 
编码 环境 下 看 才能 看 到 正确 的 文本 信息 。 为 了 能 真正 将 全 球 各 国语 言 


进行 互 换 通信 ， 出 现 了 Unicode (Universal Character Set，UCS) 标 
准 。 它 对 应 于 编码 标准 ISO/IEC 10646。Unicode 前 后 也 出 现 了 多 个 版 
本 。 早 先 的 UCS-2 采 用 固定 的 双 字 节 编 码 方式 ， 理 论 上 可 表示 
216=65536 种 字符 ， 因 此 极 大 地 涵盖 了 各 种 语言 的 文字 符号 。 


不 过 后 来 ， 标 准 委员 会 意识 到 ， 对 于 像 希 伯 来 字母 、 拉 丁字 母 等 
压根 就 不 需要 用 两 个 字 节 表示 ， 而 且 定 长 的 双 字 节 表示 与 原 有 的 
ASCII 码 又 不 兼容 ， 因 此 后 来 出 现 了 现在 用 得 更 多 的 UTF-8 编 码 标准 。 
UTF-8 属 于 变 长 的 编码 方式 ， 它 最 少 可 用 1 个 字 节 表示 1 个 字符 ， 最 多 
用 4 个 字 节 表示 1 个 字符 ， 判 别 依据 就 是 看 第 1 个 字 节 的 最 高 位 有 多 少 个 


1。 如 采 第 1 个 字 节 的 最 高 位 是 0， 那 么 该 字符 用 1 个 字 节 表示 ;最 高 3 位 


是 110， 那 么 用 2 个 字 市 表示 ; 最 高 4 位 是 1110， 那 么 用 3 个 字 节 表示 ; 
最 高 位 是 11110， 那 么 该 字符 由 4 个 字 广 来 表示 。 所 以 UTF-8 现 在 大 量 
用 于 网 络 通信 的 字符 编码 格式 ， 包 括 大 多 数 网 页 用 的 默认 字符 编码 也 
都 是 UTF-8 编 码 。 尽 管 UTF-8 更 为 灵活 ， 而 且 也 与 ASCII 码 完全 兼容 ， 
但 不 利于 程序 解析 。 所 以 现在 很 多 编程 语言 的 编译 器 以 及 运行 时 库 用 
得 更 多 的 是 UTF-16 编 码 来 处 理 源 代码 解析 以 及 各 类 文本 解析 ， 它 与 之 
前 的 UCS-2 编 码 完 全 兼容 ,但 也 是 变 长 编码 方式 ， 可 用 双 字 节 或 四 字 
节 来 表示 一 个 字符 。 如 果 用 双 字 市 表示 UTF-16 编 码 的话 ， 范 围 从 
0x0000 到 0xD7FF， 以 及 从 0xE000 到 0xFFFF。 这 里 留 出 0xD800 到 
0xDFFF， 不 作为 具体 字符 的 编码 表示 ， 而 是 用 于 四 字 世 编码 时 的 编码 
替换 。 当 UTF-16 表 示 0x10000 到 0xl10FFFF 之 间 的 字符 时 ， 先 将 该 范围 


内 的 值 减 去 0x10000， 使 得 结果 落 在 0x00000 到 0xFFFFF 范 围 内 。 然 后 
将 结果 划分 为 高 10 位 与 低 10 位 两 组 。 将 低 10 位 的 值 与 0xDC00 相 加 ， 获 
得 低 16 位 ;高 10 位 与 0xD800 相 加 ， 获 得 高 1 位 。 比 如 ， 一 个 Unicode 
定义 的 码 点 (code point) 为 0x10437 的 字符 ， 用 UTEF-16 编 码 表示 的 步 
骤 如 下 。 


1) 先 将 它 减 去 0x10000 一 0x10437-0x10000=0x0437。 


2) 将 该 结果 分 为 低 10 位 与 高 10 位 ，0x0437 用 20 位 二 进 制 表示 为 
00000000010000110111， 因 此 高 10 位 是 0000000001=0x01; 低 10 位 则 是 
0000110111， 即 0x037 。 


3) 将 高 10 位 与 0xD800 相 加 ， 得 到 0xD801; 将 低 10 位 与 0xDC00 相 
加 ， 获 得 0xDC37。 因 此 最 终 UTF-16 编 码 为 0xD801DC37 。 


我 们 看 到 ， 尽 管 UTF-16 也 是 变 长 编码 表示 ， 但 是 仅 低 16 位 就 能 
示 很 多 字符 符号 ， 训 且 即 便 要 表示 更 广 范围 的 字符 ， 也 只 是 第 二 种 四 
字 节 的 表示 方法 ， 这 远 比 UTF-8 四 种 不 同 的 编码 方式 要 简洁 很 多 。 
此 ，UTF-16 用 在 很 多 编程 语言 运行 时 系统 字符 编码 的 场合 比较 多 。 像 
现在 的 Java、Objective-C 等 编程 语言 环境 内 部 系统 所 表示 的 字符 都 是 
UTF-16 编 码 方式 。 


男 外 ， 现 在 还 有 UTF-32 编 码 方式 ， 这 一 开始 也 是 Unicode 标 准 搞 
出 来 的 UCS-4 标 准 ， 它 与 UCS-2 一 样 ， 是 定 长 编码 方式 ， 但 每 个 字符 


用 固定 的 4 子 市 来 表示 。 不 过 现在 此 格式 用 得 很 少 ， 而 且 HTML5 标 准 
组 织 也 公开 声明 开发 者 应 当 尽量 避免 在 页 面 中 使 用 UTF-32 编 码 格式 ， 
因为 在 HTML5 规 范 中 所 描述 的 编码 侦 测 算法 ， 故 意 不 对 它 与 UTF-16 
编码 做 区 分 。 
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现代 计算 机 系统 中 含有 两 种 存放 数据 的 字 节 序 : 大 端 (Big- 
endian) 和 小 端 (Little-endian) 。 所 谓 大 端 字 世 序 是 指 在 读 写 一 个 大 
于 1 个 字 节 的 数据 时 ， 其 数据 的 最 高 字 节 存放 在 起 始 地 址 单元 处 ， 数 据 
的 最 低 字 万 存放 在 最 高 地 址 单元 处 。 所 谓 小 端 字 节 序 是 指 在 读 写 一 个 
大 于 1 个 字 世 的 数据 时 ， 其 数据 的 最 低 字 他 存放 在 起 始 地 址 单元 处 ， 而 
数据 的 最 高 字 节 存放 在 最 高 地 址 单元 处 。 比 如 ， 我 们 要 在 地 址 
0x00001000 处 存放 一 个 0x04030201 的 32 位 整数 ， 其 大 端 、 小 端 存放 情 
况 如 图 2-9 所 示 。 


大 端 字 节 序 | 0x04 Grol 


地 址 Ox1000 “0xl001 0x1002 ”0x1003 


小 闹 字 闻 友 | 0x01 0x02 Ox03 Ox04 


2-9 大 端 与 小 端 


当前 ， 通 用 泉 面 处 理 右 以 及 智能 移动 设备 的 处 理 器 一 般 都 用 小 端 
字 市 序 。 通 信 设 备 中 用 大 剖 子 广 序 比较 普 裔 。 


本 书后 续 所 要 叙述 的 内 容 中 ， 帮 无 特殊 说 明 ， 都 是 基于 小 端 字 区 


2.7 按 位 逻辑 运算 

按 位 逻辑 运算 在 计算 机 编程 中 会 经 常 涉及 ， 这 些 运算 都 是 针对 二 
进 制 比特 进行 操作 的 。 所 谓 的 “ 按 位 "计算 就 是 指 对 一 组 数据 的 每 个 比 
特 逐 位 进行 计算 ， 并 且 对 每 个 比特 的 计算 结果 不 会 影响 其 他 位 。 常 用 
的 按 位 逻辑 运算 包括 “ 按 位 与 "、“ 按 位 或 "、“ 按 位 异 或 "以 及 “ 按 位 取 
反 * 四 种 。 下 面 将 分 别 介绍 这 4 种 运算 方式 。 


1) 按 位 与 : 它 是 一 个 双 目 操作 ， 需 要 两 个 操作 数 ， 在 C 语 言 中 用 
久 表 示 。 两 个 比特 的 按 位 与 结 采 如 下 : 


0&0=0; 0&1=0; 1&0=0; 1&1=1 


也 束 是 说 ， 两 个 比特 中 如 果 有 一 个 比特 是 9， 那么 按 位 与 的 结果 吏 
是 0， 只 有 当 两 个 比特 都 为 1 的 时 候 ， 按 位 与 的 结果 才 为 1。 比 如 ， 对 两 
个 字 节 01001010 和 11110011 进 行 按 位 与 的 结果 为 01000010。 按 位 与 一 
般 可 用 于 判定 某 个 标志 位 是 否 被 设置 。 比 如 ， 我 们 假定 处 理 一 个 游戏 
手柄 的 按键 事件 ， 用 一 个 字 节 来 存放 按键 被 按 下 的 标志 ， 前 4 个 比特 分 
别 表示 “上 ”、“ 下 ”、“ 左 ”、“ 右 *。 比 特 4 表 示 按 下 了 “A” 键 ， 比 特 5 表 示 
按 下 了 “B” 键 ， 比 特 6 表示 按 下 了 “X” 键 ， 比 特 7 表 示 按 下 了 “Y” 键 。 那 
么 当 我 们 接收 到 二 进 制 数 01010100 时 ， 说 明 用 户 同时 按 下 了 “ 左 ? 方 向 
键 ~“A” 键 和 “X” 键 。 那 么 我 们 判定 按键 标志 时 可 以 通过 按 位 与 二 进 制 


数 1 来 判定 是 否 按 下 了 “上 ” 键 ， 按 位 与 二 进 制 数 10 做 按 位 与 操作 来 判定 
古 否 按 下 了 “下 ” 键 ， 跟 二 进 制 数 100 做 与 操作 来 判定 是 否 按 下 

了 “ 左 ” 键 ， 以 此 类 推 。 如 果 按 位 与 的 结果 是 0， 说 明 当 前 此 按键 没有 被 
按 下 ， 如 果 结 有 果 不 为 零 ， 说 明 此 按键 被 按 下 。 


2) 按 位 或 : 它 是 一 个 双 目 操作 符 ， 需 要 两 个 操作 数 ， 在 C 语 言 
用 “表示 。 两 个 比特 的 按 位 或 结 采 如 下 : 


0I0=0; 0l1=1; 1|0=1; 1|1=1 


也 就 是 说 ， 只 要 有 一 个 比特 的 值 是 1， 那 么 按 位 或 的 结果 就 是 1， 
只 有 当 两 个 比特 的 值 都 为 0 的 时 候 ， 按 位 或 的 结 采 才 是 0。 比 如 ， 对 于 
两 个 字 节 01001010 和 11110011 进 行 按 位 或 的 结果 为 11111011。 按 位 或 
一 般 可 用 于 设置 标志 位 。 就 如 同上 述 例子 ， 如 果 用 户 按 下 了 人 “上” 键 ， 
那么 系统 底层 会 将 最 低位 设置 为 1， 如 果 用 户 按 下 了 “Y”* 键 ， 那 么 系统 
底层 会 将 最 高 位 设置 为 1。 随 后 系统 会 将 这 串 信 息 发 送 到 应 用 UI 层 。 


3) 按 位 异 或 ， 它 是 一 个 双 目 操作 ， 需 要 两 个 操作 数 ， 在 C 语 言 
用 ^ 表 示 。 两 个 比特 的 按 位 异 或 结果 如 下 


0^0=0; 0 和 ^1=1; 1^0=1; 1^1=0 


也 就 是 说 ， 如 果 两 个 比特 的 值 相同 ， 那 么 按 位 异 或 的 结果 为 0， 不 
同 为 1。 比 如 ， 对 于 两 个 字 节 01001010 和 11110011 进 行 按 位 或 的 结果 为 


10111001。 按 位 异 或 适用 于 多 种 场景 ， 比 如 我 们 用 一 个 输入 比特 与 1 进 
行 异 或 束 可 以 反 转 该 输入 比特 的 值 ， 输 入 为 0， 那 么 结果 为 1， 输 入 为 
1， 那 么 结果 为 0° 任 一 比特 与 0 异 或 ， 那 么 结果 还 是 原 比 特 的 值 。 按 位 
异 或 跟 按 位 与 和 按 位 或 不 同 ， 它 可 以 对 数据 信息 进行 登 加 组 合 。 因 为 
给 定 任 一 比特 ， 对 于 男 外 一 个 比特 的 输入 ， 不 同 的 输入 值 对 应 不 同 的 
输出 ， 所 以 我 们 通过 异 或 能 还 原 信 息 。 比 如 ， 我 们 有 两 个 整数 a 和 b， 
我 们 设 c=a^b。 对 于 c， 我 们 可 以 通过 cha 重新 得 到 b， 也 可 以 通过 cAb 来 
重新 得 到 a。 所 以 寞 或 在 信息 编码 、 数 据 加 密 等 技术 上 应 用 得 非常 多 。 


4) 按 位 取 反 : 它 是 一 个 单 目 操作 ， 只 需要 一 个 操作 数 ， 在 C 语 言 
中 用 ~ 表示 。 一 个 比特 的 按 位 取 反 结果 如 下 : ~0=1; ~1=0。 比 如 ， 对 
一 个 字 和 01001010 进 行 按 位 取 反 的 结果 为 10110101 。 


2.8 移 位 操作 


现代 处 理 器 的 计算 单元 中 一 般 都 会 包含 移 位 器 。 移 位 器 往往 能 执 
行 算术 左 移 (Arithmetic Shift Left) 、 算 术 右 移 (Arithmetic Shift 
Right) 、 逮 辑 左 移 (Logical Shift Left) 、 逮 辑 右 移 (Logical Shift 
Right) 、 循 环 右 移 (Rotational Shift Right) 这 些 操 作 。 


下 面 我 们 将 分 别 介绍 这 些 移 位 操作 ， 这 里 需要 提醒 各 位 的 是 ， 移 
位 操作 一 般 总 是 对 整数 数据 进行 操作 ， 并 且 移 入 移出 的 都 是 二 进 制 比 
特 。 然 而 ， 不 同 的 处 理 器 架构 对 移 位 操作 的 实现 可 能 会 有 一 些 不 同 。 
比如 ， 如 果 对 一 个 32 位 寄存 器 做 移 位 操作 ， 倘 若 指 定 要 移动 的 比特 数 
超过 了 31， 那 么 在 x86 处 理 器 中 是 将 指定 的 比特 移动 位 数 做 模 32 处 理 

(也 就 是 求 除 以 32 的 余数 ， 比 如 左 移 32 位 相当 于 左 移 0 位 、 右 移 33 位 相 
当 于 右 移 1 位 ) ; 而 在 ARM、AVR 等 处 理 器 中 ， 对 一 个 32 位 的 整数 做 左 
移 和 人 逻辑 右 移 超出 31 位 的 结果 都 将 是 零 。 


2.8.1 算术 左 移 与 逻辑 左 移 


由 于 算 木 左 移 与 逻辑 左 移 操作 基本 是 相同 的 ， 仅 仅 对 标志 位 的 影 
啊 有 些 区 别 ， 所 以 合并 在 一 起 讲 。 左 移 的 操作 步骤 十 分 简单 ， 假 设 我 
们 要 左 移 N 位 ， 那 么 先 将 整数 的 每 个 比特 同 互 移动 N 位 ， 然 后 空 出 的 低 


N 位 填 零 。 图 2-10 展 示 了 对 一 个 8 位 整数 分 别 做 左 移 1 位 与 左 移 2 位 的 过 
程 。 


图 2-10 算术 左 移 与 逻辑 左 移 


图 2-10 中 间 由 小 写 子 母 a~h 构 成 的 方 格 图 即 表 示 一 个 8 位 二 进 制 整 
数 ， 每 个 小 写字 母 表 示 一 比特 ， 并 且 字 和 母 a 作为 最 高 位 比特 ， 字 母 h 作 
为 最 低位 比特 。 左 移 1 位 后 ， 原 来 的 8 位 二 进 制 数 就 变 成 了 bcdefgh0; 左 
移 2 位 后 ， 原 来 的 8 位 二 进 制 数 束 变 成 了 cdefgh00。 


2.8.2 ”逻辑 右 移 
沁 辑 右 移 的 操作 步 序 是 ， 先 将 整数 的 每 一 个 比特 向 右 移动 N 位 ， 然 


后 高 N 位 用 零 来 填补 。 图 2-11 展 示 了 一 个 8 位 二 进 制 整数 分 别 逻 辑 右 移 1 
位 和 2 位 的 过 程 。 


图 2-11 逻辑 右 移 


图 2-11 中 间 由 小 写字 和 母 a~h 构 成 的 方 格 图 即 表示 一 个 8 位 二 进 制 整 
数 ， 每 个 小 写字 母 表示 一 位 比特 ， 并 且 字 母 a 作为 最 高 位 比特 ， 字 母 h 
作为 最 低位 比特 。 将 原始 二 进 制 8 位 数据 逻辑 右 移 1 位 后 ， 二 进 制 数据 
变 为 0abcdefg; 人 逻辑 右 移 2 位 后 ， 二 进 制 数据 变 为 00abcdef 。 


2.8.3 ”算术 右 移 


算术 石 移 与 逻辑 右 移 类 似 ， 只 不 过 移出 N 位 之 后 ， 高 N 位 不 是 用 零 
来 填充 ， 而 是 根据 原始 整数 的 最 高 位 ， 如 果 原 始 整数 的 最 高 位 为 1， 那 
么 移 位 后 的 高 N 位 用 1 来 填充 ， 如 果 是 0， 则 用 0 来 填充 。 图 2-12 展 示 了 
一 个 8 位 二 进 制 整数 分 别 算术 右 移 1 位 和 2 位 的 过 程 。 


图 2-12 算术 右 移 


图 2-12 中 间 由 小 写字 母 a~h 构 成 的 方 格 图 ， 即 表示 一 个 8 位 二 进 制 
整数 ， 每 个 小 写字 母 表示 一 位 比特 ， 并 且 字 母 a 作 为 最 高 位 比特 ， 字 母 
h 作 为 最 低位 比特 。 将 原始 8 位 二 进 制 整数 算术 右 移 1 位 之 后 ， 该 二 进 制 
数 变 为 aabcdefg; 将 它 算术 右 移 2 位 之 后 ， 变 为 aaabcdef 。 


2.8.4 循环 右 移 


循环 右 移 的 步 序 是 : 先 将 原始 二 进 制 整数 右 移 N 位 ， 移 出 的 N 位 依 
次 放 入 到 高 N 位 。 图 2-13 展 示 了 将 一 个 8 位 二 进 制 整数 分 别 循环 右 移 1 位 
和 2 位 的 过 程 。 


图 2-13 ”循环 右 移 


图 2-13 中 间 由 小 写字 母 a~h 构 成 的 方 格 图 ， 即 表示 一 个 8 位 二 进 制 
整数 ， 每 个 小 写字 母 表示 一 位 比特 ， 并 且 字 母 a 作 为 最 高 位 比特 ， 字 母 
h 作 为 最 低位 比特 。 将 原始 8 位 二 进 制 整数 循环 右 移 1 位 之 后 ， 该 二 进 制 
整数 变 为 habcdefg; 将 它 循环 右 移 2 位 之 后 ， 该 二 进 制 整 数 变 为 
ghabcdef 。 


2.9 本章 小 结 


本 章 大 致 介绍 了 计算 机 体系 结构 以 及 程序 执行 的 大 致 流程 ， 然 后 
描述 了 整数 以 及 浮 点 数 在 计算 机 中 的 存储 方式 ， 之 后 还 介绍 了 地 址 与 
字 市 对 齐 、 了 字符 编 码 、 处 理 右 大 并 与 小 剖 字 市 序 ， 以 及 按 位 逻辑 运算 
和 移 位 操作 。 由 于 这 些 知 识 都 是 学 习 C 语 言 必 备 的 ，C 语 言 中 有 相关 语 
法 与 这 些 概 念 对 应 ， 所 以 各 位 最 好 能 先 理解 、 掌 握 这 些 基本 知识 ， 这 
样 对 后 续 学 习 C 语 言 将 有 很 大 帮助 。 


第 3 章 ”Ci 语言 编程 的 环境 搭建 


我 们 在 第 2 章 讲述 了 学 习 C 语 言 所 必需 的 一 些 预 备 知识 。 本 章 将 给 
大 家 介绍 常用 桌面 操作 系统 下 的 C 语 言 环境 搭建 。 这 里 所 讲述 的 C 语 言 
编译 器 以 及 集成 开发 环境 (IDE) 都 是 可 合法 免费 下 载 的 ， 本 书 不 鼓 
励 各 位 使 用 盗版 或 破解 软件 ， 所 以 下 面 会 列 出 下 载 这 些 合法 免费 软件 
的 官方 链接 ， 大 家 把 编程 环境 搭建 完 之 后 即 可 上 机 实践 编程 。 


3.1 Windows 控 作 系 统 下 搭建 C 语 言 编程 环境 


Windows 操 作 系统 下 默认 不 自 带 任何 C 语 言 编 译 器 ， 大 家 必须 从 网 
上 下 载 自 己 所 需要 的 C 语 言 编 译 器 。 如 果 各 位 想 通 过 C 语 言 开 发 
Windows 系 统 平台 相关 的 应 用 ， 或 者 主要 想 在 Windows 平 台 对 C 语 言 程 
序 进行 调试 ， 那 么 往往 首选 Visual Studio Community。 这 款 开 发 环境 是 
免费 的 ， 里 面 自 带 了 微软 自家 的 C 语 言 编译 器 一 一 简称 为 MSVC。 不 过 
当前 MSVC 无 法 支持 最 新 的 C11 标 准 新 特性 ， 而 且 即 便 是 C99 标 准 也 是 
支持 得 比较 有 限 ， 所 以 它 并 不 适合 学 习 C11 最 新 标准 。 但 对 于 C 语 言 初 
学 者 而 言 ， 这 款 集成 开发 环境 还 是 非常 适合 的 。 幸 运 的 是 ，2017 年 3 月 
微软 最 新 推出 的 Visual Studio Community 2017 包 含 了 Clang 编 译 器 前 端 
工具 ， 如 果 我 们 勾 选 安装 的 话 即 可 使 用 Clang 来 作为 C 语 言 编 译 器 。 尽 
管 Visual Studio 下 的 Clang 编 译 需 尚 处 于 试验 阶段 ， 但 大 部 分 功能 都 可 用 
了 。 目 前 笔者 测试 下 来 ， 它 对 原子 操作 还 没 文 持 好 ， 另 外 像 UTF-8、 
UTF-16 等 字符 编码 问题 还 与 Windows 操 作 系统 本 身 相 关 ， 所 以 要 涉及 
这 些 问 题 的 话 ， 我 们 只 能 使 用 系统 特定 的 接口 去 解决 或 者 使 用 下 面 提 
到 的 MinGW 以 及 Clang 官 方 提供 的 编译 工具 链 去 解决 。 


所 以 ， 如 果 大 家 想 在 Windows 操 作 系 统 下 学 习 更 为 完整 的 C11 标 准 
最 新 特性 ， 那 么 建议 下 载 MinGW， 如 果 是 64 位 的 Windows 系 统 的 话 则 


最 好 下 载 Mingw-w64。 如 末 还 想 学 习 Clang 编 译作 语法 扩展 的 话 ， 也 可 
以 再 下 载 单 独 的 Clang 编 译 器 。 


3.1.1 ”安装 Visual Studio Community 2017 


Visual Studio Community 最 新 版 本 可 在 微软 的 Visual Studio 官 方 网 站 
下 载 : 


https://www.visualstudio.com/thank-you-downloading-visual-studio/? 


sku=Community&rel=15 ° 


当 我 们 下 载 好 Visual Studio Community 的 安装 程序 之 后 ， 将 它 打开 
运行 。 随 后 会 看 到 一 个 选择 安装 组 件 的 对 话 框 。 我 们 在 该 对 话 框 的 右 
侧 能 看 到 已 经 勾 选 上 的 组 件 以 及 一 些 没有 勾 选 上 的 组 件 。 这 里 我 们 必 
须 勾 选 上 “Clang/C2 (实验 ) ”这 一 项 ， 如 图 3-1 所 示 。 因 为 不 安装 
Clang， 后 面 就 无 法 用 它 编 译 C 源 代码 。 


可 选 


VC++ 2017 v141 工 且 集 {x86 x64 
C++ 分析 工 具 

Windows 10 SDK (10.0.14393.0) 

用 于 CMake 的 Visual C++ 工 且 
Visual C++ ATL 支持 

Windows 8.1 SDK 和 UCRT SDK 


[| 对 C++ 的 Windows XP 支持 
3 MFC 和 ATL Ee 和 x64) 


- Clang/C2 eh 

| 标准 库 模 块 

|_| IncrediBuild 

| ] Windows 10 SDK (10.0.10586.0) 


图 3-1 _ Visual Studio Community 安 装 界面 


安装 完成 之 后 ， 我 们 打开 Visual Studio Community 2017， 首 先 出 现 
欢迎 界面 。Visual Studio 在 首次 局 动 时 就 会 很 明显 地 提示 我 们 注册 账号 
或 用 账号 登录 。 我 们 先 用 Hotmail 或 MSN 账号 登录 注册 ， 如 果 不 注册 仅 
有 30 天 左右 的 试用 时 间 ， 但 一 旦 注册 完 之 后 就 能 永久 使 用 了 “。 我 们 登 
录 完 自己 的 账号 之 后 就 可 以 开始 新 建 一 个 C 语 言 的 项 目 工程 了 。 


我 们 找到 某 单 栏 最 左边 的 “文件 >， 然 后 选择 “新 建 "， 再 点 击 “ 项 
目 "”， 如 图 3-2 所 示 。 


座 项目 (P)… 


禾 ”网 站 (W)… 
二 ”文件 (P).-. 
从 现 有 代码 创建 项 目 {E}... 


图 3-2 ”欢迎 界面 中 新 建 项 目 


随后 我 们 会 看 到 新 建 项 目的 对 话 框 。 在 左 侧 边 栏 中 找到 “Visual 
C++”， 然 后 选中 *Win32”， 随 后 在 中 间 栏 选择 “Win32 Console 
Application”， 最 后 ， 在 底下 输入 此 工程 创建 后 存放 的 目录 路 径 以 及 工 
程 名 ， 如 图 3-3 所 示 。 


Sortby:[Defaut -| 时 Search Installed Templates (ctd+6 -| 


国 win2 console Application Type: Visual C++ 
4 Templates py A project for creating a Win32 console 
b Visual C# Win32 Project pplication 
b Visual Basic 
4 Visual C++ 


Visual Studio Solutions 
Samples 


b Online 


Ci\Wwc_programs\ - 
v 


图 3-3 ”Visual Sutdio 新 建 项 目 


扩 击 “OK” 按 钮 后 进入 应 用 设置 疝 导 界面 ， 如 图 3-4 所 示 。 


我 们 看 到 图 3-4 这 个 界面 时 ， 先 别 着 急 点 击 “ 下 一 步 ” 按 钮 ， 应 先 点 
击 左 边 边 栏 中 的 “应 用 程序 设置 "， 对 此 进行 初步 配置 。 然 后 进入 图 3-5 
所 示 的 界面 。 


Win32 应 用 程序 向 导 - cdemo 


| 欢迎 使 用 Win32 应 用 程序 向 导 


概 壕 这 些 是 当前 项 目 设置 

应 用 程序 设置 * 控制 台 应 用 程序 
在 任 一 窗口 中 单 击 “ 完 成 ”， 接 受 当 前 设置 。 
创建 项 目 后 ， 请 参阅 该 项 目的 readme. txt 文件 ， 
的 信息 


站 一 
Ba? 


图 3-4 ”Visual Studio 应 用 设置 向 导 


应 用 程序 类 型 : 
C 〇 ) Windows 应 用 程序 凶 ) 
〇 DLLO) 
〇 静态 库 (s) 


附加 选项 : 
空 项 目 (E) 
国 导出 符号 (X) 
园 预 编译 头 {F) 


图 3-5 Visual Studio 项 目 创建 时 的 应 用 设置 


图 3-5 所 示 的 界面 中 ， 在 “附加 选项 ”中 ， 先 取消 义 克 “ 预 编译 头 ”， 
然后 色 选 “ 空 项 目 ”。 最 后 ， 点 击 “ 完 成 ”按钮 进入 到 我 们 所 创建 的 cdemo 


项 目 工程 的 主 界面 。 此 时 ， 整 个 工程 古 空 的 ， 只 有 文件 夹 而 没有 任何 
文件 ， 需 要 手工 新 建 C 源 文件 。 用 鼠标 右键 单 击 “ 源 文件 ”， 选 择 “ 添 
加 ”， 然 后 再 点 击 “ 新 建 项 ”， 如 图 3-6 所 示 。 


解决 方案 资源 管理 器 
Rd 
搜索 解决 方案 资源 管理 器 (Ctr|+;) 

网 解决 方案 cdemo"(1 个 项 目 ) 
4 cdemo 
b we 引用 
嘱 外 部 依赖 项 
缠 头 文件 


> 新 建 项 (W)... Ctrl+Shift+A 
Ctrl+Shift+X 现 有 项 (G)... Shift+Alt+A 
新 建 第 选 嚣 (F) 
类 (QQ. 
Ctrl+X 资源 (R).… 


图 3-6 ”Visual Studio 添 加 C 源 文件 


在 随后 弹出 的 如 图 3-7 所 示 的 对 话 框 中 ， 远 中 中 间 栏 中 的 “C++ 文 件 
Ccpp) " 那 一 项 ， 然 后 在 确 下 “名 称 ” 一 栏 输入 源 文件 名 。 


testcl 
ojects\cdemo\cdemo\ 


图 3-7 Visual Studio 命 名 C 源 文件 名 


Os 这 里 需要 注意 ， 默 认 文件 后 缀 名 是 .cpp， 即 C++ 源 文 
件 ， 因 为 Visual C++ 默认 采用 C++ 编程 语言 ， 因 此 我 们 这 里 要 手工 填 


写 .c 文 件 后 缀 名 ， 使 得 后 续 我 们 用 C 编 译 亿 进行 编译 构建 整个 控制 台 应 
用 。 


完成 之 后 ， 我 们 点 击 “ 添 加 ”按钮 ， 然 后 再 次 进入 工程 主客 面 ， 此 
时 即 可 看 到 C 源 文件 的 编辑 界面 了 。 


我 们 在 进入 源 文件 编辑 界面 后 ， 先 对 Visual Studio 的 文本 编辑 选项 
做 些 处 理 ， 以 便于 我 们 后 续 可 以 流畅 地 编写 代码 。 如 图 3-8 所 示 ， 我 们 
在 上 面 的 菜单 栏 找到 “工具 ”， 然 后 选择 “选项 ”。 


连接 到 数据 库 (D)… 

连接 到 服务 器 (S)… 

Web 代码 分 析 

代码 片段 管理 圳 (T)... Ctrl+K, Ctrl+B 
选择 工具 箱 项 (X)… 


创建 GUID(G) 
错误 查找 (K) 
Spy++(+) 
外 部 工具 (E).… 
导入 和 导出 设置 (1).. 
自 定义 (CQ).. 

净 ”选项 (O).. 


图 3-8 ”Visual Studio 准 备 设置 编辑 选项 


点 击 进入 后 能 看 到 如 图 3-9 所 示 的 对 话 框 。 在 左边 栏 找 到 “文本 编辑 
器 ”这 个 选项 ， 然 后 将 它 展开 ， 选 中 * 所 有 语言 ”， 随 后 我 们 勾 选 上 “ 行 


号 ”， 这 样 ， 在 编辑 每 个 文本 文件 时 都 能 看 到 行 号 ， 便 于 我 们 查找 代码 
中 的 语法 错误 以 及 调试 代码 用 。 


襄 ] 启用 虚空 格 (V) 
口 自动 找 行 (W) 

[上 | 显示 可 视 的 自动 换行 标志 符号 (S) 
过 行 号 (LD 


回 启用 单 击 URL 定位 (U) 
加 导航 栏 (N) 
国 ] 自动 大 括号 完成 (B) 


图 3-9 ”设置 编辑 选项 


最 后 ， 再 选中 “ 制 表 符 ? 挝 项 ， 对 制 表 符 进 行 设置 ， 如 图 3-10 所 示 。 
习惯 上 ， 我 们 一 般 将 Tab Size 设 置 为 4 个 半角 字符 ， 缩 进 大 小 也 是 4 个 半 
角 字 符 ， 然 后 每 个 制 表 符 用 4 个 空格 代 稚 ， 这 样 用 其 他 编辑 需 浏 览 
Visual Studio 编 辑 过 的 产 文 件 也 不 会 寻 致 格式 错 配 。 


图 3-10 Visual Studio 设 置 制 表 符 


接 下 来 我 们 设置 当前 的 项 目 工程 的 属性 选项 。 我们 找到 沫 单 栏 
的 “项 目 ”， 然 后 点 击 “cdemo 属 性 *， 如 图 3-11 所 示 。 


Ctrl+Shift+X 


Ctrl+Shift+A 
Shift+Alt+A 


图 3-11 ” Visual Studio 设 置 项 目 属性 


在 配置 界面 的 常规 页 面 中 〈 见 图 3-12) ， 先 找到 左上 角 的 “配置 ” 选 
项 ， 选 择 “ 所 有 配置 ”。 这 样 ， 我 们 后 续 做 的 所 有 配置 都 对 Debug 模 式 与 
Release 模 式 同 时 有 效 。 然 后 ， 在 右 侧 找到 “平台 工具 集 *， 这 里 需要 选 


择 使 用 “Visual Studio 2017-Clang with Microsoft CodeGen”， 这 个 选项 使 
得 我 们 对 当前 的 项 目 工程 使 用 Clang 编 译 工 具 链 进行 编译 构建 。 


Windows 10 
10.0.14393.0 
VC++ 目录 $(SolutionDir)$(Configuration)\ 
by C/C++ $(Configuration)\ 


链接 器 示 $(ProjectName) 
上 清单 了 具 - - .| 二 - - 
bXML 文档 生成 器 *.cdf*.cache;*.obj:*.obj.enc:*.ilk:*.ipdb:;*.iobj:*.resources:;*.tlb;*.t 
上 浏览 信息 $(IntDir)$(MSBuildProjectName).log 
》 生 成 事件 RS 
定义 生成 步 又 Visual Studio 2017 (v141) 
Visual Studio 2017 - Windows XP (v141 xp) 


)17 - Clang with Microsoft CodeGen (v141 clang_c2) 


图 3-12 ”Visual Studio 对 cdemo 项 目 工 程 的 常规 设置 


随后 我 们 展开 C/C++ 这 一 项 ， 此 时 仍然 需要 先 将 左上 和 角 的 “配置 ” 设 
置 为 “所 有 配置 ”。 然 后 找到 “语言 >， 将 “C 语 言 标准 ?设置 为 GNU11 标 
准 。 这 样 我 们 就 能 在 Visual Studio Community 集 成 开发 环境 下 编写 调试 
大 部 分 基于 GNU11 标 准 的 C 语 言 代码 了 。 设 置 如 图 3-13 所 示 。 


C++ 语言 标准 
VC++ 目录 
4 C/C++ 


C11 (-std=c11) 
C99 (GNU Dialect) (-std=gnu99) 
C11 (GNU Dialect) (-std=gnu11) 


< 从 父 级 或 项 目 默认 设置 继承 > 


图 3-13 ”Visual Studio 设 置 C 语 言 标准 


全 都 设置 完成 之 后 ， 我 们 就 可 以 编写 第 一 个 C 语 言 程序 了 。 同 一 般 
C 语 言 教 程 一 样 ， 我 们 这 里 也 通过 输出 一 个 “Hello，world! ”字样 ， 作 
为 第 一 个 C 语 言 代码 的 演示 程序 。 我 们 输入 图 3-14 中 所 示 的 代码 ， 然 后 
点 击 工 具 栏 中 的 绿色 三 角 箭头 (图 3-14 中 用 矩形 框 圈 出) 即 可 编译 运行 
了 。 在 程序 最 后 的 getchar () 作用 在 于 : 弹出 的 控制 台 应 用 不 会 在 程 
序 终止 时 马上 自动 关闭 ， 而 是 等 用 户 输入 一 个 回 车 时 再 关闭 。 


-日 | 站 -外 日 册 |2 -Se > | enco -| 
[7624] cdemo.exe -| 轩 生命 周期 事件 ”线程 : IE 


#include <stdio.h> 
日 int maintvoid) 
puts("Hello, world!*). 
getchar (). 


} 
因 CA\my programs\vc projects\cdemo\x64\Debug\cdemo.exe 


Hello，worldl 


1 
3 
四 
5 
6 
了 
8 
9 


图 3-14 ”在 Windows 控 制 台 输出 字符 串 


在 图 3-14 所 示 的 界面 中 ， 椭 圆圈 出 来 的 部 分 用 于 设置 当前 程序 以 调 
试 模式 构建 还 是 以 发 布 模式 构建 。 如 果 以 调试 模式 构建 ， 我 们 可 以 利 


用 Visual Studio 内 建 的 调试 右 做 断 点 跟踪 ， 查 看 局 部 对 象 与 全 局 对 象 状 
态 以 及 寄存 器 状态 等 ， 便 于 调试 程序 。 如 果 以 发 布 模式 构建 ， 那 么 当 
前 程序 会 被 大 幅 优化 ， 使 得 程序 运行 性 能 大 幅 提升 ， 但 难以 调试 。 图 3- 
14 中 ， 中 间 用 矩形 框 圈 出 的 部 分 是 设置 当前 目标 程序 的 执行 模式 ， 默 
认为 x86， 即 32 位 执行 模式 。 这 里 我 们 将 它 设置 成 了 64 位 执行 模式 。 


3.1.2 ”安装 MinGW 编 译 器 


MinGW 编 译 器 是 著名 开源 C 语 言 编 译 器 GCC 对 Windows 操 作 系 统 的 
一 个 移植 版 本 。 通 过 MinGW， 我 们 就 可 以 在 Windows 下 享用 大 部 分 
GCC 编 译 器 所 带 来 的 强大 功能 了 。 这 对 跨 平 台 的 C 语 言 开 发 而 言 十 分 有 
用 。 下 面 我 们 就 来 介绍 如 何 下 载 安装 MinGW 编 译 器 


首先 ， 我 们 直接 进入 这 个 网 址 下 载 安装 文件 : 
http://sourceforge.net/projects/mingw/files/latest/download’? source=files ° 
这 个 文件 非常 小 ,因为 MinGW 采 用 的 是 在 线 安装 模式 ， 萃 取 线 上 各 个 
最 新 release 版 本 的 组 件 进行 下 载 。 


然后 ， 我 们 双击 安装 包 ， 初 步 安装 完毕 后 弹出 对 话 框 如 图 3-15 所 
示 “” 绿色 进度 条 表示 已 经 安 效 好 了 


MinGW Installation Manager Setup Tool 


mingw-get version 0.6.2-beta-20131004-1 


名 


Step 2: Download and Set Up MinGW Installation Manager 
Downioad Progress 


Catalogue update completed; please check 'Details' pane for errors. 


| Processed 110 of 110 items 2 100 % 


ngw-get: *** INFO *** : Unpacking mingw-get-setup-0.6.2-mingw32-beta-2 A 


司 
3 全 业 全 了 NIFO 二 全 二 : Updating installation database 
也 和 -二 生 全 工人 MIFO 关 二 二 : register mingw-get-0.6.2-mingw32-beta-20131004 


.Xz 
et: = INEFO = : register mingw-get-0.6,2-mingw32-beta-20131004 
SN 
et = MPO 十 二 全 : register mingw-get-0.6.2-mingw32-beta-20131004 
> 
2 三 要 要 NFO 二 二 二 : installation database Updated 


图 3-15” ”MinGW 初步 安装 成 功 


我 们 点 击 “Continue” 按 钮 后 ， 出 现 选 择 安装 更 多 组 件 的 对 话 框 。 我 
们 在 左 侧 栏 点 击 “Basic*"， 即 采用 基本 安装 。 然 后 ， 在 右 侧 栏 安装 上 
部 列 出 的 组 件 。 要 选中 某 个 安装 组 件 ， 鼠 标 右键 该 包 名 ， 然 后 在 快捷 
菜单 中 选择 “Mark for Installation” 命 令 ， 如 图 3-16 所 示 。 


名 MinGW Installation Manager 
Installation package Settings 
a Package als Installed Version 
MinGw 
MsYs Unmark 
WSYS Base System 


MinGy Developer Toolkit 


Mark for Installation 
MSYS System Builder Mark for Reinstallation 
Mark for Upgrade 


Mark for Removal 


| General | Description De | Installed Files Ea 


An WSYS Installation for WinG¥ Developers (meta) 


图 3-16” MinGW 安装 ， 选 中 安装 包 


全 都 选择 好 之 后 ， 我 们 最 后 更 新 刚 选 好 的 安装 包 。 我 们 在 染 单 栏 
选中 “Installation”， 然 后 点 击 “Update Catalogue”， 如 图 3-17 所 示 。 


By MinGW Installation Manager 


Installation | Package Settings 
Update Catalogue Jackage Class ‘Installed Version 


Mark All Upgrades new—developer—toolkit bin 
new32—autoconf bin 


Apply Changes 
PPY "9 Inew32—-autoconf lic 


Quit new32-autoconf2. 1 bin 
inew32—autoconf2. 1 doc 

加 mingw32-autoconf2.1 lic 

minew32—autoconf2.5 bin 


图 3-17 MinGW 更 新 安装 包 


之 后 会 弹出 如 图 3-18 所 示 的 界面 ， 点 击 最 左边 的 “Review 
Changes” 按 饪 ， 会 弹出 如 图 3-19 所 示 的 对 话 框 。 


You have marked packages for installation, upgrade, or removal, 

全 but you have not yet committed these changes; if You update 
Re can they wil be 
discarded, and you may need to reschedule them. 


You are advised to review your marked changes, before you update the 
catalogue; (you may select the "Review Changes” option button below), or 
altematively, you may simply discard the changes, unseen, or you may cancel 
this request to update the catalogue. 


[ Review changes | | Discard changes | | CancelRequest | 


图 3-18 ” ”MinGW 安装 要 求 确认 


点 击 “Apply” 按 钮 之 后 ， 就 会 下 载 安装 设置 更 新 后 的 安装 包 。 等 竺 
全 都 安装 完毕 后 ， 点 击 “Close” 按 钮 ， 退 出 整个 安装 程序 。 


Okay to proceed? 


0 


0 installed packages wil be removed 


bregex-1. 20090805-2-msys-1.0 
ere 20050421_1-2-msys- 1.0. 13-diT1-0: tar. lzma 


图 3-19 MinGW 安装 更 新 


安装 结束 后 ， 不 要 着 急 使 用 ， 而 是 先 将 MinGW 的 bin 文 件 夹 注册 到 
环境 变量 中 。 先 打开 ”文件 资 源 管 理 器 ”， 在 左 侧 栏 中 找到 “此 电 
脑 ? 或 “我 的 电脑 ”， 鼠 标 右键 单 击 它 ， 选 择 “ 属 性 ”， 进 入 后 点 击 左 侧 
的 “高 级 系统 设置 *， 如 图 3-20 所 示 。 


图 3-20 ”进入 环境 变量 的 设置 界面 


进入 图 3-20 的 对 话 框 之 后 ， 点 击 “ 环 境 变 量 ? 按 钮 ， 进 入 到 “环境 变 
量 ” 对 话 框 。 我 们 在 “系统 变量 ”区 域 夺 中 “Path” 变 量 ， 然 后 扩 击 “编辑 ” 按 
钮 ， 弹 出 “编辑 系统 变量 ”对 话 框 。 在 “变量 值 ”中 往 后 添加 刚才 安 准 后 的 
MinGW 中 的 bin 文 件 夹 所 在 目录 。 在 环境 变量 中 的 每 个 值 之 间 用 半角 分 


号 “; ”进行 分 隅 ， 如 图 3-21 所 示 。 


Windows NT 

CANprogramDataVOracleWavaVavapath'C.-- 
PATHEXT COM:.EXE:.BATCMD'.VBS;.VBE:.jS:JSE:. 
PROCESSOR AR... 


图 3-21 进入 环境 变量 设置 Path 


完成 之 后 ， 我 们 就 可 以 打开 控制 全 程序 (方法 是 右键 桌面 上 左下 
角 “ 开 始 ” 按 钮 ， 然 后 选择 命令 提示 符 ) ， 然 后 进入 要 编译 的 C 源 文件 所 
在 的 目录 。 然 后 用 gcc 命 令 对 指定 C 源 文件 进行 编译 构建 ， 如 图 3-22 所 


修 ° 


这 里 ， 我 们 借用 之 前 在 Visual Studio Community 下 编辑 好 的 源 文件 
test.c。 我 们 先 用 cd 命令 定位 到 test.c 所 在 的 目录 。 然 后 用 gcc--version 命 
令 查 看 当前 GCC 编 译作 的 版 本 。 最 后 ， 用 gcc-std=gnu11 test.c 进 行 编 
译 ， 最 终 在 当前 目录 生成 a.exe 可 执行 文件 。 我 们 直接 键入 a， 回 车 ， 即 
可 看 到 程序 输出 结 


要 注意 的 是 ，MinGW 是 32 位 的 C 语 言 编译 器 ， 所 以 它 构 建 出 来 的 
程序 也 是 32 位 的 。 如 果 各 位 用 的 Windows 操 作 系 统 是 64 位 的 ， 那 么 可 以 
使 用 Mingw-w64 编 译 器 。 下 载 地 址 如 下 : 
https://sourceforge.net/projects/mingw-w64/files/latest/download? 


source=files ° 
Mingw-w64 的 安装 、 设 置 过 程 与 32 位 的 MinGW 类 似 ， 这 里 不 再 歼 


了 述 。 


pA 


3.1.3 ”安装 LLVM Clang 编 译 器 


LLVM (Low Level Virtual Machine) 起 源 于 一 个 大 学 项 目 ， 它 是 一 
个 编译 器 基础 架构 项 目 ， 用 于 设计 一 组 具有 良好 定义 的 、 可 重用 的 
库 。LLVM 起 移 用 于 替代 GCC (这 里 的 GCC 是 指 GNU Compiler 
Collection) 栈 中 的 代码 生成 器 ， 然 后 对 GCC 中 已 有 的 许多 编译 器 进行 
修改 以 适 配 LLVM。 后 来 LLVM 发 起 了 开发 一 个 全 新 的 适用 于 不 少 编程 
语言 的 编译 器 前 端 ， 称 为 Clang。Clang 主 要 支持 C、C++、Objective-C 
等 编程 语言 ， 并 且 主 要 由 Apple 公 司 大 力 文 持 和 维护 。LLVM 与 Clang 都 
基于 BSD 许 可 证 ， 比 GPL 更 宽松 。 正 因 如 此 ， 现 在 许多 硬件 商都 逐渐 开 
台 投 入 对 LLVM 的 支持 ， 像 Khronos 开 放 标 准 组 织 也 基于 LLVM IR 
(Intermediate Representation) 开发 出 了 自己 的 一 套 SPIR-V。Clang 编 译 
器 在 语法 上 力争 支持 各 大 主流 编译 器 的 语法 扩展 ， 包 括 GCC 和 
MSVC， 所 以 微软 也 已 经 把 Clang 纳 入 Visual Studio 集 成 开发 环境 的 工具 


集中 。 


2016/1/3 19:11 文件 夫 
2016/1/3 19:09 文件 夫 
2016/1/5 2:54 应 用 程序 
2016/1/4 0:58 VC++ Project 
加 cdemo.vcxproj.filters 2016/1/3 19:11 VC++ Project Fil... 
同 cdemo.vcxproj.user 2016/1/3 19:08 Visual Studio Pr. 
四 testc 2016/1/4 1:38 C Source 


icrosoft Windows [It 本 与 
《c>》 2913 Microsoft 2 “ 哥 留 所 有 权利 。 


:sers\cy2cd CGC:Wwc_programs cdemo\cdemo 


:WCc_programs \cdemo vcdemofscc -version 
gcc 《GCC 4.8 .1 


opyright 〈《C) 28613 Free Software Foundation, Inc. 
his is free software; See the source for copbying conditions. There is NO 
Jarranty; not even for MERCHANTABILITY or FITNESS FOR f PARTICULAR PURPOSE. 


:Wc_programs cdemo\cdemolgcc -std=gnull test.c 


Ta NcdemoNcdemo >a 


:WCc_programs cdemo \cdemo> 


图 3-22 ”用 GCC 构 建 C 程 序 


我 们 首先 在 LLVM Clang 官 网 下 载 最 新 稳定 发 布 版 本 的 Clang 安 装 
包 : http:Vllvm.org/releases/download.html。 然 后 ， 要 注意 的 是 选择 32 位 
版 本 ， 如 图 3-23 所 示 。 


Documentation: 


LLVM (release notes) 
Clang (release notes) 
LLVM Doxygen (. tar. x2) 
Clang Doxygen (. tar. x2) 


Pre-Built Binaries: 


Csig) 


for army7a Linux (.si 


Linux (. sig) 
(sig) 


*。 OQpenMP runtime for x86 64 Linux (. sig) 
* OpenMP runtime for Darwin (. sig) 


Signed with PGP key 345AD05D. 


图 3-23” ”下载 Clang for Windows (32-bit) 


由 于 Clang 主 要 是 一 个 编译 器 前 疗 ， 因 此 它 需 要 依赖 其 他 编译 右 的 
连接 顺 以 及 某 些 运行 时 库 。 所 以 ， 我 们 光 安 装 Clang 是 无 法 直接 成 功 构 


建 应 用 程序 的 ， 因 而 我 们 要 使 用 Clang 的 话 ， 必 须 在 此 之 前 先 把 MinGW 
安装 好 。MinGW 是 32 位 的 ， 因 此 为 了 二 进 制 兼容 ， 我 们 所 选取 的 Clang 
也 必须 是 32 位 的 。 当 然 ， 如 果 之 前 安装 的 是 64 位 的 MingW-W64， 那 么 
这 里 需要 下 载 安装 64 位 的 Clang 。 


安装 Clang 的 过 程 非常 简单 ， 可 根据 安装 癌 导 简单 地 做 些 选择 即 可 
完成 安装 。 安 装 完成 后 ， 可 以 去 “系统 ”里 的 环境 变量 中 看 ， 把 LLVM 晶 
录 下 的 bin 文 件 夹 的 路 径 添加 到 Path 环 境 变量 中 ， 如 图 3-24 所 示 。 然 后 
就 可 以 再 次 使 用 命令 行 工具 直接 编译 运行 程序 了 。 


a.exe 2016/1/5 22:24 
cdemo.vcxproj 2016/1/4 0:58 
BB] cdemo.vcxproj.filters 2016/1/3 19;11 


i cdemo.vcxproj-user 2016/1/3 19:08 


BB test.c 2016/1/4 1:38 


clang version 3.7.0 《tags/h 
arget: i686—pc—-windows—gnu 
hread model: posix 


: wc_programs \cdemo'\cdemo»>a 


:wc_programs cdemo\cdemo> 


图 3-24 ”用 Clang 编 译 器 构建 应 用 程序 


3.2 macOS 系 统 下 搭建 C 语 言 编 程 环 境 


macOS 系 统 也 不 上 默认 目 市 C 语 言 编译 器 。 然 而 ， 用 户 可 以 目 己 去 
Mac App Store 倪 费 下 载 macOS 下 的 强大 开发 工具 
https://itunes.apple.com/cn/app/Xcode/id497799835? mt=12。 该 集成 开发 
工具 采用 Apple 定 制版 本 的 Clang 编 译 袁 ， 称 为 Apple LLYM 编 译 硕 。 它 
自 融 C、C++、Objective-C 以 及 Apple 上 自己 新 推出 的 Swift 编程 语言 编译 
磋 ， 还 有 一 系列 功能 强大 的 代 公 静 态 分 析 以 及 性 能 剖析 工具 。 


Xcode: 


下 载 完 Xcode 之 后 ， 把 它 打 开 。 如 果 是 第 一 次 启动 ，Xcode 会 自动 
更 新 一 些 资源 ， 完 了 之 后 弹出 主 界面 ， 如 图 3-25 所 示 。 


我 们 选择 第 二 个 选项 ， 点 击 它 即 可 创建 应 用 程序 工程 。 第 一 个 选 
项 仅 用 于 操练 把 玩 Swift 编 程 语 言 ， 而 第 二 个 选项 用 于 创建 真正 的 应 用 
或 库 。 当 然 ， 有 些 应 用 可 直接 提交 到 App Store 审 核 ， 有 些 则 不 行 。 


氮 击 “Create a new Xcode project”* 之 后 ， 出 现 图 3-26 所 示 的 对 话 框 。 
在 图 3-26 中 ， 我 们 看 到 在 上 面 一 栏 中 所 选 的 项 目 工程 为 macOS 的 应 用 。 
然后 在 下 边 ， 我 们 选择 “Command Line Tool”， 即 命令 行 工 具 。 最 左边 
的 Cocoa Application 用 于 创建 macOS 系 统 上 基于 GUI 以 及 沙 盒 机 制 的 应 
用 ， 它 可 以 上 传 到 Mac App Store。 中 间 的 “Game” 专 门 用 于 游戏 应 用 ， 
也 可 上 传 到 Mac App Store。 而 最 右边 的 “Command Line Tool”* 构 建 出 来 


的 应 用 则 无 法 上 传 到 Mac App Store， 但 是 它 能 访问 macOS 的 整个 文件 
系统 ， 并 且 没 有 采用 沙 盒 机 制 。 另 外 ， 开 发 者 用 Command Line Tool 开 
发 出 来 的 应 用 也 可 以 直接 放 到 网 上 供 其 他 人 下 载 使 用 。 


Welcome to Xcode 


Version 8.2.1 {8C1002) 


Get started with a playground 
Explore new ideas quickly and easily. 


Create a new Xcode project 
Create an app for iPhone, iPad, Mac 吉 pple Watch or Apple TV. 


Check out an existing project 
Start working on something from an SCM repository. 


图 3-25 ”Xcode 欢迎 界面 


Choose atemplate for your new project: 


iDS watchOS tvyOS Cross-platform 


Application 


A 


Cocoa Command Line 
Application Tool 


图 3-26 ”选择 MacOS 命 令 行 工具 应 用 项 目 


我 们 点 击 “Next” 按 钮 之 后 出 现 如 图 3-27 所 示 的 对 话 框 。 在 第 1 行 用 
英文 输入 自己 的 产品 名 称 ， 这 个 后 面 将 用 于 自动 生成 的 工程 名 称 。 
后 第 2 行 填写 组 织 名 。 第 3 行 填写 组 织 标识 ， 格 式 为 com.< 公 司 名 >.< 产 
品名 >。 当 然 ， 第 2、 第 3 行 对 于 我 们 的 demo 而 言 可 以 随意 填写 。 第 5 行 
我 们 要 选择 C， 表 示 使 用 C 语 言 。 


Product Name: ‘CDemo | 


Organization Name: |GreenGames Studio 


Organization Identifier: com.greengames.cdemo 


Bundle Identifier: com.greengames.cdemo.CDemo 


Language: | C 


图 3-27 ”输入 macOS 命 令 行 应 用 的 属性 


点 击 “Next” 按 钮 可 看 到 图 3-28 所 示 的 目录 选择 对 话 框 。 


bp 
bp 
bp 
bp 
bp 
pe 
了 
bp 
Pp 
bp 
> 
bp 


ll Programs 


Create Git repositoryP 


e will place your project under version control 


图 3-28 ”macOSs 命 令 行 应 用 生成 目录 选择 对 话 框 


这 里 选择 将 新 创建 的 项 目 工程 放 到 哪个 目录 下 。 另 外 ， 这 里 要 注 
意 的 是 ， 我 们 不 要 勾 选 “Create Git repository” 这 一 选项 。 因 为 它 会 在 工 
程 本 地 做 git 版 本 管理 ， 对 于 我 们 一 般 应 用 而 言 没 有 任何 必要 ， 而 且 这 
会 随 着 工程 构建 的 次 数 增多 而 增 大 ， 很 占 磁 盘 空 间 。 而 且 如 果 要 将 本 
地 工程 拷贝 到 其 他 环境 ， 也 会 市 来 许多 不 便 。 我 们 最 后 点 击 “Create” 按 
钮 之 后 ， 工 程 就 会 被 创建 好 。 


工程 被 创建 完 之 后 ，Xcode 默 认 会 打开 ， 包 括 会 自动 创建 一 个 
main.c 的 C 语 言 源 文件 。 此 时 ， 我 们 不 用 着 急 编辑 、 运 行 ， 可 以 先 设 置 
一 下 编译 选项 


我 们 百 先 点 击 蓝 色 的 “CDemo" 项 目 工程 图 标 ， 然 后 点 击 中 间 一 
住 %TARGETS” 下 的 “CDemo” 控 制 台 图 标 ， 最 后 在 右边 栏 的 最 上 方 选 
中 “Build Settings”， 然 后 在 下 面 选 中 “All* 和 “Combined”。 随后， 我 们 找 
到 “Apple LLVM x.x-Language” 这 一 栏 ， 将 *C Language Dialect” 选 为 
gnul1， 这 个 选项 将 贯穿 本 书 内 容 。 到 此 ， 我 们 的 C 语 言 编 译 选 项 丈 设 
定好 了 ， 如 图 3-29 所 示 。 


Resource Tags Build Settings| i Build Rules 


Basic All Combined Levels 


VY Apple LLVM 7.0 - Language 
Setting 


'char Type ls Unsi ee 


According to File Type 人 
Enable Linking With Shared Libraries Yeso 
Enable Trigraphs No 人 
Generate Floating Point Library Calls No 人 
Increase Sharing of Precompiled Headers No 人 

Precompile Prefix Header No 人 
Prefix Header 

Recognize Built-in Functions Yes 了 
Recognize Pascal Strings Yes 2 
Short Enumeration Constants No 人 
Use Standard System Header Directory Searching Yes 人 


图 3-29 macOS 项 目 设置 工程 配置 选项 


如 采 我 们 想 对 最 终生 成 的 代码 再 做 一 些 优 化 ， 可 以 设置 图 3-30 中 的 
= 


了 Apple LLVM 7.0 - Language - C++ 
Setting | CDemo 


C++ Language Dialect GNU++11[-std=gnu++11] 仿 
C++ Standard Library 


了 Apple LLVM 7.0 - Language - Modules 
Setting 
Allow Non-modular Includes In Framework Modules 
Enable Clang Module Debugging 
Enable Modules (C and Objective-C) 
Link Frameworks Automatically 


Vv Apple LLVM 7.0 - Language - Objective C 
Setting 
Enable Objective-C Exceptions 
| Link Ob CR 


图 3-30 macOS 项 目 设置 其 他 编译 选项 


我 们 将 C++ 的 异常 以 及 运行 时 类 型 (RTTI) 全 都 关闭 ， 男 外 也 将 
Objective-C 的 异常 天 闭 。 这 样 ， 最 终 的 应 用 程序 中 将 不 会 包含 异常 
栈 ， 同 时 ， 编 译 器 后 端 优 化 也 能 更 省 力 不 少 。 大 家 可 以 观察 到 ， 将 这 
儿 个 选项 关闭 后 ， 最 终生 成 的 可 执行 文件 会 比 开 局 时 要 小 一 些 。 


最 后 ， 我 们 可 以 设置 一 下 Xcode 自身 的 偏好 设置 ， 将 行 号 显示 出 
来 ， 如 图 3-31 所 示 。 


图 3-31 打开 Xcode 偏好 设置 


我 们 在 菜单 栏 上 ， 选 择 “Xcode”， 然 后 点 击 “Pre-ferences...”， 弹 出 
图 3-32 所 示 的 对 话 框 。 我 们 把 “Line numbers” 勾 选 上 即 可 在 文本 编辑 框 
中 看 到 行 号 。 男 外 ，Xcode 默 认 字 符 编 码 已 经 是 UTF-8 了 ， 因 此 不 需要 
我 们 做 额外 的 设置 。 


Text Editing 


a@ 必 邻 罗 | 于 避 国 息 四 


General Accounts Behaviors Navigation Fonts & Colors MextEditing Key Bindings Source Control Downloads Locations 


Editing Indentation 


[MLine numbers 
OD Code folding ribbon 
[Focus code blocks on hover 


口 Page guide at column: 80| 12 
[v) Highlight instances of selected symbol 


Delay: 0.25 |“| seconds 


Code completion: [VY] Suggest completions while typing 

Use Escape key to show completion suggestions 
Automatically insert closing braces ("}") 

Enable type-over completions 


[M Automatically balance brackets in Objective-C method calls 


四 
四 
四 
由 


While editing: [Y] Automatically trim trailing whitespace 
OD Including whitespace-only lines 
Default text encoding: | Unicode (UTF-8) 

Default line endings: | OS X / Unix (LF) 
DO Convert existing files on save 


Code coverage: [Y] Show iteration counts 


图 3-32 Xcode 设置 文本 编辑 属性 


由 于 Xcode 默认 字体 可 能 会 显得 比较 小 ， 因 此 如 果 想 设置 字体 以 及 
背景 颜色 的 话 可 以 选择 “Fonts&Colors” 选 项 。 


在 进入 到 此 对 话 杠 后， 我 们 点 击 左 侧 栏 下 边 的 “+ 号， 添加 一 个 新 
的 字体 ， 并 且 选 择 “Duplicate‘Default*”， 如 图 3-33 所 示 。 这 使 得 我 们 所 
新 增 的 字体 以 默认 字体 和 颜色 作为 基准 ， 然 后 对 它 做 大 小 修改 。 


Duplicate "Default” 


New Theme from Template 


图 3-33 Xcode 字体 设置 ， 添 加 新 字体 


如 图 3-34 所 示 ， 我 们 这 里 新 增 了 一 个 叫 “Defualt_Big” 的 字体 ， 然 后 
在 中 间 这 栏 ， 我 们 先 选 中 “Plain Text”， 然 后 将 滚动 条 滚动 到 最 下 方 ， 
按 住 Shift 键 再 选中 最 后 一 条 “Other Preprocessor Macros”， 这 样 可 以 将 所 
有 种 类 的 文字 格式 全 都 选中 ， 随 后 我 们 点 击 “T" 字 样 的 按钮 来 调整 这 些 
文字 格式 的 字体 大 小 。 这 里 ， 原 先 的 字体 大 小 为 “Menlo Regular- 

11.0”， 设 置 之 后 这 里 变 为 “Menlo Regular-14.0”。 


Source Editor Console 


Presentation 
Presentation Large 


Printing 


加 国 | 


Selection 


w= en 


Cursor Invisibles 


图 3-34 Xcode 设置 狐 字 体格 式 与 大 小 


现在 ， 我 们 就 可 以 直接 运行 Xcode 自 动 帮 有 我 们 生成 好 的 main.c 中 的 


C 源 代码 了 。 我 们 直接 点 击 右 上 角 的 三 角 箭 头 按钮 即 可 编译 并 运行 这 上 段 
代码 ， 如 图 3-35 所 示 。 


oo00 CC] mewsww 
白 中 A 9 于 马 同 | 昭 |《< >》| 国 Coemo) 站 | CDemo) [© main.c ) No Selection 
v | CDemo main.c 

蚂 


CDemo 


> | products Created by Zenny Chen on 15/12/29. 
Copyright © 2015 年 GreenGames Studio. All rights reserved. 
#include <stdio.h> 
0 
和 main(int argc, const char * argv[]) 
2 
// insert code here... 
printf(u8"Hello，World!\n 你 好 ， 世 界 ! \n"); 
} 


图 3-35 ”编译 运行 macOS 控 制 台 应 用 


我 们 在 下 面 的 调试 控制 台中 能 看 到 图 3-35 这 两 行文 学 。 其 中 ， 最 后 
一 句 是 应 用 退出 后 系统 目 动 打印 的 。 我 们 可 以 看 到 ，macOS 下 能 非常 
轻松 地 直接 输出 中 文 ， 而 不 需要 各 种 复杂 的 编码 转换 。 


Hello, World! 


你 好 ， 世 界 ! 
Program ended with exit code: 9 


All Output © 


图 3-36 ”macOSs 控 制 台 程 序 运 行 结 


3.3 “本章 小 结 


本 章 主要 讲述 了 Windows 操 作 系统 下 如 何 使 用 Visual Studio 
Community、MinGW 和 LLVM Clang 进 行 C 语 言 程 序 开 发 ， 同 时 也 讲解 
了 如 何在 macOS 下 使 用 Xcode 做 C 语 言 程序 开发 。 因 为 Windows 操 作 系 
统 与 macOS 系 统 用 得 比较 广泛 ， 而 且 它们 都 主要 基于 GUI 的 集成 开发 
环境 进行 编程 ， 所 以 我 们 做 重点 讲解 。 而 在 各 个 版 本 的 Linux 下 基本 都 
默认 安装 了 GCC 编译 器 ， 各 位 可 以 直接 在 Linux 系 统 下 的 命令 行 终端 使 
用 gcc 命 令 对 C 语 言 源 文件 做 编译 构建 。 而 当前 FreeBSD 最 新 发 布 版 本 
默认 使 用 了 LLVM Clang 编 译 右 ， 各 位 也 可 以 直接 在 命令 行 终端 使 用 
clang 命 令 对 C 语 言 源 文件 做 编译 构建 。 


男 外 ，Linux、FreeBSD 系 统 下 ， 笔 者 推荐 使 用 的 集成 开发 环境 是 
Eclipse。 它 拥有 比较 基本 的 代码 智能 感知 ， 设 置 断 点 进行 调试 的 功 
能 ， 而 且 它 也 是 一 球 开 源 免 费 的 软件 。 当 然 ， 要 启动 Edlipse 必 须 先 下 
载 JRE (Java Runtime Environment) ， 这 个 可 以 从 Oracle 官 网 下 载 。 


截至 本 章 ， 第 一 部 分 的 讲解 结束 ， 各 位 读者 应 该 对 C 语 言 的 由 
来 、 用 途 以 及 各 种 准备 工作 都 了 解 得 差不多 了 吧 2? 下 面 我 们 将 进入 第 
二 部 分 正式 开局 CGC 语言 赔 法 的 大 1?! 


和 | 
gol 
旺 


: 
。 
- 
- 


基础 语法 篇 


名 


二 


由 


己 刘 

中 | 引 上 
8 

号 


问 
问 
灵活 的 


多 答 | | 
时 
加 


指 
指 


| 


第 4 章 C 语 言 中 的 基本 元 系 


本 章 将 正式 进入 C 语 言 编程 话题 。 我 们 在 第 1 章 已 经 大 致 介绍 了 C 语 
言 的 编译 、 连 撑 和 加 载运 行 流 程 ， 参 见 图 1-2。 我 们 首先 介绍 C 语 言 
个 源 文 件 的 基本 构成 以 及 基本 元 素 。 


main.c 、 又 

CDemo 注释 

Created by Zenny Chen on 15/12/29. 

Copyright @ 2015 年 GreenGames Studio. ALL rights reserved. 


#include <stdio.h> — 预 处 理 器 


主 国 数 入 口 


int main(int argc, const char * argv[]) 


// insert code here... 二 一 一 注释 


puts (u8"Hello，World!\n 你 好 ， 世 界 ! "); 


] 
2 
3 
4 
5 
6 
8 
9 
0 
1 
2 
3 
4 
5 
6 
7 
8 


图 4-1 C 源 文件 的 基本 构成 


我 们 在 图 4-1 中 能 看 到 ， 一 个 可 用 来 编译 执行 的 基本 C 源 文件 主要 


和 包 合 个 部 让 


第 1 部 分 是 注释 。 注 释 主 要 用 于 给 源 代码 做 批注 ， 方 便 阅 读 和 维 
护 。 编 译 器 会 名 略 所 有 注释 部 分 ， 而 且 注释 部 分 在 预 编译 处 理 结束 后 


就 不 存在 了 。 我 们 将 在 10.9 广 讨论 程序 注释 。 


第 2 部 分 是 预 处 理 器 (Preprocessor) 。 图 4-1 中 的 第 9 行 代码 就 是 一 
条 ##include 预 处 理 絮 ， 它 将 标准 库 头 文件 “stdio.h” 中 的 所 有 内 容 都 直接 
放 到 当前 源 文 件 中 ， 这 样 我 们 就 可 以 将 它 看 作 在 第 9 行 这 个 位 置 插 入 此 
头 文件 的 所 有 内 容 (这 里 我 们 可 以 先 无 视 上 面 的 注释 部 分 的 处 
理 ) 。“stdio.h” 文 件 包含 了 第 16 行 所 用 到 的 puts 标 准 库 画 数 的 原型 。 我 
们 将 在 第 10 章 详细 讨论 预 处 理 器 。 


第 3 部 分 是 主 函 数 入 口 main。 它 是 C 程 序 的 入 口 函 数 。 也 就 是 说 ， 
当 操 作 系 统 加 载 完 我 们 构建 生成 的 C 程 序 后 ， 率 先 执行 的 就 是 main 画 
数 。 关 于 main 芳 数 ， 我 们 将 在 9.9 廊 中 介绍 。 


第 4 部 分 是 用 {} 包 围 着 的 函数 具体 实现 代码 《第 13~17 行 ) 。 这 里 
的 实现 束 是 第 16 行 打印 输出 两 行文 子 。 


C 语 言 的 头 文 件 一 般 用 .h 后 级 表示， 源 文件 一 般 用 .c 后 缀 表示 。C 源 
文件 是 一 个 文本 文件 ， 所 以 它 是 由 一 系列 字符 构成 的 。 下 一 节 将 介绍 C 
源 文件 中 可 用 的 字符 集 以 及 执行 C 程 序 时 可 用 的 字符 集 。 


4.1 C 语 言 中 的 字符 集 


一 般 来 总， 编程 语言 的 字符 集 都 可 分 为 两 组 : 一 组 叫 源 字符 集 ， 
男 一 组 叫 执行 子 符 集 。 所 请 “ 源 字 符 集 ”是 指 在 写 C 源 代码 时 用 的 字符 
集 ， 也 束 是 对 现在 C 源 文件 中 的 字符 集 。 而 “执行 字符 集 ? 是 指 编译 构 
建 完 源 文件 后 的 目标 二 进 制 文 件 中 所 表示 的 字符 集 ， 它 将 用 于 运行 在 
当前 的 执行 环境 中 。 比 如 ， 我 们 在 控制 台 或 者 GUI 和 窗口 视图 上 所 看 到 
的 文字 信息 束 属 于 执行 字符 集 。 


C 语 言 标准 允许 C 语 言 实现 采用 多 字符 扩展 字符 集 ， 但 是 必须 要 满 
足 一 组 基本 字符 集 。 基 本 字符 集 都 包含 在 ASCII 码 可 显 字符 集中 ， 包 
括 半 角 的 大 写字 母 A~Z、 小 写字 和 母 a~~z、 半 角 的 阿拉 伯 数 字 0 到 9 以 及 


下 列 符号 


为 了 叙述 方便 ， 上 述 这 排 符号 后 续 将 统称 为 “标点 符号 ” 而 大 小 
写 半角 英文 字母 统称 为 “字母 ”， 半 和 角 阿 拉 伯 数字 0 到 9 统称 为 “数字 ”。 


由 于 在 C 语 言 的 上 述 基 本 字符 集中 有 9 个 字符 超出 了 ISO 646 不 变 字 
符 集 的 范围 ， 分 别 是 : # 人 入 [ ] | { } ~。 所 以 ,在 C90 标 准 


中 就 引入 了 三 字符 连 拼 (Trigraph) 的 方式 来 表达 这 9 个 字符 : 
? ?= 对 应 于 # 
?2?) 对 应 于 ] 
P| 
we 
下 
?2 3 30 
20 记 
?? < 对 应 于 { 
PR 村 
例如 : 


?3?=def?ine arraycheck(a, b) a??(b??) ?3?313?31 b??(a??) 
printf(“Eh???/n” ); 

// 上 述 代码 等 价 于 : 
#define arraycheck(a, b) arb] || braj] 
printf(“Eh?\n” ); 


这 里 我 们 还 能 再 呈现 一 下 源 字 符 集 与 执行 字符 集 的 差异 。 上 述 代 
码 中 ,“? ? ? /n” 表 示 源 字符 集 ， 它 在 C 源 文件 中 整 是 如 此 写 的 ， 而 最 


后 翻译 成 的 mn” 束 相当 于 执行 子 符 集 ， 显 示 在 命令 行程 序 中 束 古 一 个 
换行 。 


由 于 C++17 标 准 打算 废弃 三 字符 连 拼 ， 笔 者 估计 下 一 个 C 语 言 标准 
也 将 废弃 三 字符 连 拼 机 制 ， 因 此 不 建议 各 位 使 用 ， 大 家 只 要 了 解 一 下 
这 个 历史 即 可 。 


C99 标 准 中 引入 了 对 其 中 5 个 字符 的 双 字 符 连 拼 (Digraph) 表示 。 
<: ”对 应 于 [ 
: > 对 应 于 ] 
<% 对 应 于 { 
%> 对 应 于 } 
%: ”对 应 于 # 


双 字 符 连 拼 在 下 一 个 标准 中 还 能 正 稼 使 用 。 尽 管 Trigraph 与 
Digraph 基 本 用 不 上 ， 不 过 在 看 一 些 较 早 之 前 欧洲 一 些 国家 的 人 所 写 的 
代码 时 能 知道 那 是 什么 。 由 于 笔者 在 日 本 做 过 一 些 项 目 ， 所 以 知道 在 
Windows 系 统 下 的 日 语 环 境 中 ，“” 这 个 符号 会 被 显示 成 “车”*”。 因此 当 
我 们 看 到 “学 ”符号 时 能 反应 出 是 “就 行 。 


4.2 ”Ci 语言 中 的 token 


在 编程 语言 中 经 常会 涉及 “token” 这 个 词 ，token 这 里 不 是 指 网 络 通 
信 中 所 谓 的 “ 令 牌 >， 而 是 用 于 词法 解析 的 ， 通 过 指定 一 个 词 位 ( 词 的 单 
位 ) 的 类 别 来 结构 化 表示 该 词 位 。 如 以 下 代码 : 


int a= 3 << 2 


这 里 就 有 7 个 token， 分 别 是 : int、a、=、3、<<、2 以 及 最 后 的 分 
号 ; 。 这 一 行 代码 中 就 已 经 列 出 了 C 语 言 中 的 常用 几 种 token， 分 别 是 关 
键 字 (int) 、 标 识 符 (a) 、 字 面 量 (3 和 2) 、 操 作 符 (= 和 <<) 、 其 
他 标点 符号 (; ) 。 每 个 token 之 间 用 空白 符 或 标点 符号 进行 分 隔 。 空 
日 符 主要 包括 空格 (white space) 、 制 表 符 (tab) 以 及 换行 回 车 。 像 上 
述 代 码 也 能 写成 以 下 形式 ， 两 者 是 等 价 的 。 


int a=3<<2,; 


但 是 ， 这 里 int 与 a 之 间 必 须 用 空 日 符 分 割 。 


C 语 言 标准 中 定义 了 token 和 预 处 理 token， 分 别 用 于 在 编译 时 和 巴 
编译 时 的 符号 解析 。token 包 括 关键 字 、 标 识 符 、 常 量 、 字 符 趾 字面 量 


以 及 标点 符号 。 预 处 理 token 主 要 包括 头 文件 名 、 标 识 符 、 预 处 理 数 、 


悦 


字符 第 量 、 字 符 串 字面 量 、 标 点 从 号 以 及 不 属于 上 述 符 号 的 每 个 非 空 


下 面 我 们 将 分 别 摘 述 标识 符 、 天 键 字 、 和 常量 与 字符 串 字 面 量 、 标 
点 符号 这 几 种 token。 预 处 理 token 将 放 在 第 10 章 做 详细 描述 。 


4.2.1 CC 语 言 中 的 标识 符 


在 C11 标 准 中 提 到 ，C 语 言 中 的 标识 符 可 以 表示 一 个 对 象 
(object) ， 一 个 函数 (function) ， 一 个 结构 体 (structure) 、 联 合体 
(union) 或 枚 举 (enumeration) 的 一 个 名 字 (C11 标 准 中 将 结构 体 、 联 
合体 以 及 枚 举 类 型 的 名 字 称 为 tag) 或 其 中 一 个 成 员 、 一 个 typedef 名 、 
一 个 跳 转 标签 (label) 名 、 一 个 宏 (macro) 名 或 一 个 宏 的 形 参 
(parameter) 。 当 我 们 提 到 “标识 符 ?" 时 ， 要 意识 到 标识 符 不 仅仅 是 上 壕 
所 描述 实体 的 名 称 ， 而 且 也 是 对 它们 的 引用 (reference) 


一 般 C 语 言 的 实现 约定 ， 一 个 标识 符 由 基本 字符 集中 的 所 有 大 小 写 
英文 字母 、 阿 拉 伯 数字 0 到 9 以 及 下 划 线 构成 ， 并 且 标 识 符 不 能 以 数字 
开头 。 比 如 : aBc、_ab、C11、_3 都 是 有 效 的 标识 符 ; 5ab、a (2、 
886 都 是 无 效 的 标识 符 。 有 些 C 语 言 实 现 允 许 将 $ 作 为 构成 标识 符 的 有 效 
字符 ， 但 有 些 是 将 含有 $ 的 标识 符 作 为 一 种 内 部 使 用 的 特殊 符号 来 用 ， 
所 以 我 们 在 命名 标识 符 的 时 候 应 该 避免 使 用 $ 符 号 。 此 外 ，C11 标 准 允 


许 使 用 多 字 节 扩展 字符 集 (通用 字符 名 ) 来 命名 标识 符 ， 但 不 能 违背 
上 述 基本 约定 。 比 如 ， 在 Apple LLVM 编 译 器 中 ， 人 允许 使 用 中 文 、 拉 丁 
字母 、 希 腊 字 母 等 作为 标识 人 特 : avno、bonné、 小 乌 游 :六 伦 、 了 7 一 x 
等 都 是 有 效 标识 符 ， 但 是 像 3 百 九 、 十 * 二 ， 这 些 就 是 无 效 的 标识 符 。 
此 外 ，C 语 言 标准 中 还 规定 ， 如 果 一 个 标识 符 含有 通用 字符 名 ， 那 么 每 
一 个 通用 字符 名 必须 落 在 ISO/IEC 10646 编 码 方式 的 以 下 范围 内 (用 十 
六 进 制 表示 ) : 


1) 00A8, 00AA, 00AD, 00AF, 00B2~00B5,，00B7~00BA, 
00BC~00BE, 00C0~00D6, 00D8~00F6,00F8~00FF; 


2) 0100~167F,，1681~180D,，180F~1FFF; 


3) 200B~200D, 202A~202E,203F~2040，2054，2060~ 
206F ; 


4) 2070~218F, 2460~24FF, 2776~2793，2C00~2DFF，2E80 
~2FFF:; 


5) 3004~3007，3021~302F，3031~303F: 
6) 3040~D7FF: 


7) F900~FD3D, FD40~FDCF, FDFO~FE44, FE47~FFFD:; 


8) 10000~1FFFD, 20000~2FFFD, 30000~3FFFD，40000~ 
4FFFD, 50000~5FFFD, 60000~6FFFD, 70000~7FFFD, 80000~ 
8FFFD, 90000~9FFFD, AO0000~AFFFD, BO000~BFFFD, C0000~ 
CEFFFD, DOO00~DFFFD, EO000~EFFEFD° 


此 外 ， 标 识 符 的 第 一 个 通用 字符 名 不 能 落 在 以 下 范围 内 : 0300~ 
036F, 1DCO~1DFF, 20D0~20FF, FE20~FE2F° 


在 C 语 言 标准 中 没有 特别 设 定 一 个 标识 符 的 最 大 长 度 。 不 过 具体 的 
C 语 言 实现 可 以 根据 上 自己 的 情况 设 定 标识 符 最 大 长 度 。 


在 同一 作用 域 (scope) 内 ， 一 个 标识 符 应 该 指定 一 个 确切 的 实 
体 。 如 采编 译 右 在 当前 上 下 文中 无 法 判定 某 个 标识 符 用 于 引用 哪个 实 
体 ， 那 么 束 会 发 生 编 译 错误 。 关 于 作用 域 的 详细 介绍 请 参见 11.1 广 。 


4.2.2 ”CC 语言 中 的 天 键 字 


在 编程 语言 中 所 谓 的 “关键 字 ”(keyword) 是 指 被 编程 语言 编译 器 
保留 用 作 特 定语 义 的 token， 它 们 不 能 被 程序 员 当 作 其 他 标识 符 来 使 
用 。C11 标 准 中 的 关键 字 见 表 4-1。 


表 4-1 ”C11 标准 中 的 关键 字 


关键 字 可 用 的 C 语言 标准 


auto 自动 存储 类 说 明 符 C90 
break 循环 与 选择 分 支 的 退出 语 乌 C90 


case 选择 语句 块 中 的 case 语句 C90 
char C90 
const 常量 类 型 限定 符 C90 
continue 循环 中 跳 过 当前 迭代 C90 


( 续 ) 


关键 字 可 用 的 C 语言 标准 
default 默认 条 件 的 case C90 


do 与 while 语句 连用 ， 引 出 循环 语句 块 C90 
double 双 精 度 浮 点 类 型 C90 


else 其 他 条 件 的 分 支 C90 
enum 枚 举 类 型 说 明 符 C90 
extern 外 部 存储 类 说 明 符 C90 


float 单 精度 浮 点 类 型 C90 
for 引出 for 循环 语句 C90 
goto 跳 转 语句 C90 


让 条 件 分 支 语 句 C90 
long 长 整数 类 型 C90 


inline 内 联 函 数 说 明 符 C99 
型 


register 寄存 器 存储 类 说 明 符 C90 
restrict 访 存 模式 受 限 的 指针 类 型 限定 符 C99 
return 函数 返回 语句 C90 


signed C90 
sizeof 获取 类 型 与 对 象 大 小 操作 符 C90 
static C90 
struct C90 


switch 选择 语句 C90 
typedef 类 型 定义 存储 类 说 明 符 C90 


union C90 
volatile 易 变 存储 对 象 的 类 型 限定 符 C90 


while 引出 while 循环 语句 C90 


| 11) 


_Generic 引出 泛 型 表达 式 Cll 
_Imaginary C99 
_Noreturn 无 返回 函数 说 明 符 Cll 
_Static_assert 静态 断言 Cll 


_Thread_local 线程 本 地 私有 存储 类 说 明 符 Cll 


在 上 述 关键 字 中 有 些 是 由 大 写 、 小 写 以 及 下 划 线 混合 组 成 的 ， 各 
位 在 编写 代码 的 时 候 需 要 注意 大 小 写 。 这 些 关 键 子 会 从 第 5 章 开始 分 


i 


ee 


看 到 以 上 这 些 关 键 字 读者 可 能 会 感到 奇怪 ， 为 何 有 些 关键 字 是 以 
下 划 线 打头 的 呢 ? 以 下 划 线 打头 的 关键 字 均 是 从 C99 标 准 开 始 引 入 的 。 
由 于 在 C99 之 前 ， 有 不 少 C 语 言 编译 器 已 经 对 C99 标 准 新 引入 的 特性 给 


字 。 而 通过 C 语 言 新 标准 引入 痢 的 标准 库 可 使 得 这 些 天 键 字 能 被 统一 。 


所 以 ， 大 家 在 使 用 以 下 划 线 打头 的 关键 字 时 ， 请 尽量 先 引 入 相应 
的 标准 库 头 文件 ， 然 后 使 用 非 下 划 线 形式 的 相应 关键 字 。 比 如 ， 
<stdbool.h> 头 文件 中 将 _Bool 类 型 定义 为 了 bool 类 型 ，<complex.h> 头 文 
件 中 将 _Complex 定 义 为 了 complex， 等 等 。 我 们 最 好 使 用 bool 、complex 
来 代 奉 _Bool 和 _Complex， 这 样 一 来 书写 更 为 简 少 ， 二 来 又 有 更 好 的 辐 
前 兼容 以 及 跨 平 台 等 特性 。 当 然 ， 还 有 一 些 关 键 字 是 没有 相应 标准 库 
定义 形式 的 ， 比 如 _Generic， 我 们 在 使 用 的 时 候 直 接 用 _Generic 即 可 。 


4.2.3 “C 语 言 中 的 销量 与 字符 串 字 面 量 


C 语 言 中 ， 篆 量 (contant) 有 4 种 ， 分 别 是 整数 常量 、 浮 点 数 常 
量 、 枚 举 前 量 以 及 字符 常量 。 每 个 肖 量 都 具有 一 个 特定 的 类 型 以 及 该 
音量 所 指定 的 值 ， 香 量 值 必须 在 其 类 型 所 能 表示 的 范围 内 。 整 数 常 量 


和 字符 常量 将 在 5.1 节 中 描述 ， 浮 点 数 常量 将 在 5.2 节 中 描述 ， 枚 举 常量 


字符 串 字 面 量 我 们 之 前 已 经 见 过 了 ， 图 4-1 中 的 u8“Hello，worldm 
你 好 ， 世 界 ! * 就 是 一 个 字符 串 字 面 量 。 在 C11 中 ， 一 个 字符 串 字面 量 
由 一 对 双 引 号 包 庄 的 一 系列 的 字符 构成 。 如 果 字 符 串 中 含有 诸如 回 
车 、 双 引号 等 字符 的 话 ， 需 要 对 它们 进行 转 义 ， 转 义 字 符 将 在 5.1.6 节 
中 描述 。 此 外 ， 字 符 串 的 第 一 个 双 引 号 前 可 以 加 u8、u 和 U 这 三 种 前 


绥 。u8 指 定 了 该 字符 串 字面 量 是 一 个 UTF-8 字 符 串 ，u 表 示 该 字符 串 字 


面 量 是 一 个 UTF-16 字 符 串 ;，U 表 示 该 字符 串 字 面 量 是 一 个 UTF-32 字 符 
串 。 如 果 不 加 前 级 ， 则 默认 为 当前 系统 实现 的 字符 编码 格式 。 字 符 串 
字面 量 将 在 7.10 节 做 进一步 描述 。 


4.2.4 CC 语言 中 的 标点 从 号 


C 语 言 的 标点 符号 如 下 : 


/ % << >> < > <= >= 


<: : > <% %> %: 9290: %: 


标点 符号 是 具有 独立 语法 和 语义 意义 的 符号 。 它 作为 一 个 要 执行 
的 操作 时 ， 又 称 为 操作 符 (operator) 。 操 作 符 所 作用 的 实体 称 为 操作 
数 (operand) 。 比 如 ，3+2 这 个 表达 式 中 ，+ 是 一 个 操作 符 ， 表 示 整 数 
加 法 操作 。 而 3 和 2 则 是 + 的 操作 数 ，3 作 为 + 的 左 操作 数 ; 2 作为 + 的 右 操 
作 数 。 


上 述 列 出 的 标点 符号 中 ， 有 些 无 法 单独 成 为 一 个 操作 符 ， 比 如 
[、]，(、) 等 ， 而 是 需要 将 它们 组 合 起 来 [ ]、( ) 才 行 。 而 在 ( 
) 操作 符 里 边 的 表达 式 则 作为 该 操作 符 的 操作 数 。 比 如 : 《3+2) 的 操 
作 数 是 表达 式 3+2。 此 外 ， 有 些 标点 符号 可 进行 组 合 形成 一 个 操作 符 ， 
比如 <<、+=、>>= 等 。 这 些 组 合 标点 符号 之 间 不 允许 珊 有 衬 日 待 ， 比 如 


<< 表 示 左 移 操 作 ， 而 < “< 仅仅 表示 两 个 小 于 号 。 


C 语 言 中 ， 操 作 符 按照 可 作用 的 操作 数 个 数 来 分 可 分 为 单 目 操作 符 
(unary operator) 、 双 目 操作 符 (binary operator) 和 三 目 操作 符 


(ternary operator) 。 


1) 单 目 操作 符 有 ! (表示 逻辑 非 )》、& (用 作 地 址 操作 符 时 ) 、* 
(作为 间接 操作 符 时 ， 、+ (表示 正 数 符号 时 ) 、- (表示 负数 符号 
时 ) 、~ (表示 按 位 取 反 ) 。 


2) 双 目 操作 符 有 ++ (表示 自 增 操作 ) 、-- (表示 自 减 操作 ) 。 


3) 三 目 操作 符 只 有 一 组 ， 即 ? 与 : 的 组 合 ， 作 为 条 件 表达 式 的 操 


作 符 ， 这 将 在 8.2 节 中 详细 描述 。 


其 余 的 ， 除 了 # 和 幸 作 为 预 处 理 操作 符 之 外 ， 上 述 列 出 的 操作 数 中 
都 是 双 目 操作 符 。 


不 同 的 操作 符 可 能 会 有 不 同 的 计算 优先 次 序 。 在 计算 一 个 表达 式 
时 ， 如 采 该 表达 式 含有 多 个 操作 符 ， 那 么 这 些 操作 符 按 照 优先 级 高 的 
先 开始 计算 ， 然 后 再 计算 低 优 先 级 的 操作 。 如 采 几 个 操作 符 具 有 相同 
优先 级 ， 那 么 按照 从 左 到 右 的 顺序 依次 计算 。 在 C11 标 准 中 定义 了 如 下 
表达 式 的 计算 优先 次 序 ， 排 列 从 高 到 低 。 


1) 基本 表达 式 : 标识 符 、 常 量 、 字 符 串 字面 量 、 圆 括号 表达 式 
(比如 (3+2) ) 、 泛 型 表达 式 。 


2) 后 级 操作 符 ， 数组 下 标 比如 a[0]) 、 画 数 调 用 、 结 构 体 与 联 
合体 成 员 访问 操作 符 〈. 和 ->) 、 后 级 自 增 及 自 减 操作 符 (比如 at+; a- 


-) 、 复 合 字面 量 (比如 (int[]) {1，2，3}) 。 


3) 单 目 操作 符 : 前 绥 目 增 与 上 自 减 操作 符 、 地 址 操作 符 与 间接 操作 
符 (比如 ++a; --a) 、 单 日 算术 操作 符 (+、-、! 、~， 其 中 这 里 的 
+ 和 -表示 正 负 号 ) 、sizeof 操 作 符 与 _Alignof 操 作 符 。 


4) 类 型 投 映 操作 符 ( 详 见 5.6 季 ) 。 
5) 乘法 操作 符 〈 包 括 乘 、 除 、 求 余数 *、/ 八 %) 。 


Ss) O 


6) 加 法 操作 符 


Se 


7) 移 位 操作 符 〈 左 移 、 右 移 ) 。 


8) 关系 操作 符 (大 于 、 小 于 、 大 于 等 于 、 小 于 等 于 ) 。 
9) 相等 性 操作 符 (等 于 和 不 等 于 ,==、! =) 。 

10) 按 位 与 操作 符 。 

11) 按 位 异 或 操作 符 。 

12) 按 位 或 操作 符 。 

13) 逻辑 与 操作 符 。 


14) 逻辑 或 操作 符 。 


15) 条 件 操作 符 〈 即 三 目 表 达 式 ) 。 
16) 赋值 操作 符 。 

17) 逗号 操作 符 。 

下 面 举 一 个 简单 的 例子 : 


int a=3+2*10/4--(3 - 2); 


上 述 代码 中 ， (3-2) 最 先 被 计算 得 到 结果 1， 然 后 再 计算 - (1) 的 
结果 是 -1， 然 后 计算 2*10 的 结果 等 于 20， 再 计算 20/4 的 结果 等 5， 再 是 
3+5 的 结果 等 于 8， 然 后 是 8- (-1) 的 结果 是 9， 最 后 是 将 结果 9 赋值 给 变 


= 


里 aa 


4.3 ”关于 C 语 言 中 的 “对 和 象 ” 


C11 标 准将 “对 象 ” 定 义 为 执行 环境 中 的 数据 存储 区 域 ， 对象 中 的 内 
容 用 于 表达 它 的 值 。 当 引用 了 某 一 对 象 时 ， 该 对 象 就 可 称 为 具有 一 个 
特定 类 型 。 言 下 之 意 ，C 语 言 标准 中 的 “对 象 " 是 指数 据 实 体 ， 而 不 是 
一 个 函数 。 此 外 ， 它 具有 一 个 特定 的 存储 区 域 ， 无 论 是 在 寄存 右 中 还 


是 在 存储 器 中 。 另 外 ， 它 具有 一 个 特定 的 类 型 。 


C 语 言 不 是 一 门面 向 对 象 的 编程 语言 ， 所 以 这 里 的 “对 象 "与 面向 
对 象 编程 语言 所 涉及 的 对 象 概念 有 些 差 别 ， 不 过 从 范围 上 来 讲 ， 这 里 
的 “对 象 " 比 面 加 对象 中 的 对 象 苑 围 更 广 。 从 总 体 上 将 对 象 进行 划分 可 
分 为 两 大 类 一 变量 和 稼 量 。 


-变量 是 指 在 程序 运行 时 ， 人 允许 该 对 象 所 存放 的 值 被 修改 。 


常量 是 指 在 程序 运行 时 ， 该 对 象 所 存放 的 值 不 允许 被 修改 。 


在 C 语 言 实现 中 ,向量 可 以 被 写 入 ROM， 尤 其 对 于 磐 入 式 设备 而 
言 ， 更 有 可 能 如 此 。 这 样 ， 一 旦 对 某 个 稼 量 对 象 进行 修改 ， 那 么 系统 
会 直接 发 出 异 解 。 而 在 通用 昌 面 操作 系统 中 ， 秆 量 也 被 分 配 在 RAM 
中 ， 所 以 我 们 仍然 可 以 通过 类 型 转换 或 是 其 他 奇 拉 泽 巧 对 常量 对 和 象 进 
行 修改 ， 不 过 后 末 是 无 法 预 佑 的 。 


在 计算 机 编程 语言 中 还 有 一 个 比较 香 见 的 概念 吏 是 字面 量 。 在 传 
统 编程 语言 中 ， 字 面 量 束 是 指 在 源 代 码 中 用 于 表示 一 个 固定 值 的 文字 


J 


比如 ， 像 3、-10、3.14、'"hello" 等 都 属于 字面 量 。 


其 中 : 


-3、-10 表 示人 整数 字面 量 。 


.3.14 表 示 浮 点 数字 面 量 。 


"hello" 表 示 一 个 字符 串 字 面 量 。 


这 些 字面 量 往往 都 是 常量 ， 而 像 一 般 的 整数 字面 量 在 概念 上 我 们 
也 无 需 关 心 它 到 底 是 不 是 一 个 对 象 ， 即 不 需要 关心 它 有 没有 自己 的 存 
储 空间 。 由 于 字面 量 以 及 像 (3+2) 等 常量 表达 式 是 在 编译 时 就 能 计 
算出 结果 的 ， 所 以 对 于 这 些 字面 量 的 算术 逻辑 计算 也 无 需 在 程序 运行 
时 体现 出 来 。 


外 ，C11 还 包括 了 结构 体 、 联 合体 以 及 数组 的 复合 字面 量 。 这 
字面 量 无 需 是 常量 ， 而 且 它们 目 己 所 包含 的 元 素 也 完全 可 以 旦 
变量 ， 并 且 在 运行 时 也 完全 可 被 修改 。 


I> 沿 


4.4 _C 语 言 中 的 “副作用 ” 


在 很 多 编程 语言 中 都 会 提 到 “副作用 ” (side effects) 这 个 概念 。 在 
C11 标 准 中 对 副作用 是 这 么 描述 的 ， 对 一 个 易 变 对 象 的 访问 、 对 一 个 
对 象 的 修改 、 对 一 个 文件 的 修改 ,或 调用 一 个 函数 ， 所 有 这 些 操作 都 
具有 副作用 。 副 作用 对 执行 环境 中 的 状态 做 了 改变 。 对 一 个 表达 式 的 
计算 通常 包 合 了 对 值 的 计算 以 及 对 副作用 的 初始 化 。 对 一 个 左 值 表 达 
式 的 值 计算 包含 了 判定 该 表达 式 所 表示 对 象 的 标识 。 


通常 来 讲 ， 所 谓 副 作用 就 十 在 C 源 代码 中 的 某 一 条 表达 式 在 目标 
程序 中 执行 时 ， 对 当前 程序 的 执行 状态 产生 了 或 法 在 产生 改变 ， 那 么 
我 们 称 该 表达 式 产生 了 副作用 。 所 谓 程 序 执行 状态 包 售 了 许多 元 素 ， 
比如 对 目标 程序 指令 、 寄 存 器 的 值 、 存 储 器 中 的 数据 等 。 


4.5 C 语 言 标准 库 中 的 printf 函 数 


我 们 这 里 先 简单 介绍 一 下 本 书后 续 会 大 量 使 用 的 控制 台 字 符 串 输 
出 函数 printf。 这 是 一 个 C 语 言 标 准 库 函 数 。printf 函 数 的 原型 为 : 


int printf(const char * restrict format, ...); 


此 函数 第 一 个 参数 format 是 一 个 字符 串 格 式 符 ， 后 面 的 省 略 号 表 
示 不 定 个 数 的 参数 ， 这 些 参数 的 数据 类 型 需要 分 别 与 format 所 指 辐 的 
字符 串 中 的 格式 匹配 。 函数 最 后 返回 的 是 一 个 int 类 型 整数 ， 表 示 被 伟 
递 到 控制 台 的 字符 的 个 数 。 如 采 答 出 或 者 字符 串 编码 发 生 错误 ， 那 么 
该 贸 数 将 返回 一 个 负 值 。 但 当前 大 部 分 编译 占 的 实现 并 非 返 回 传递 到 
控制 全 的 字符 个 数 ， 而 是 字 世 个 数 ， 这 对 输出 UTF-8 编 码 的 字符 串 时 
尤为 如 此 。 


下 面 简单 介绍 一 下 本 书 中 常用 的 format 字 符 串 中 的 格式 符 。 


1) %c: 对 应 参数 是 一 个 int 类 型 ， 但 实际 运行 时 会 将 该 int 类 型 对 
象 转 换 为 unsigned char 类 型 。 


2) %d: 对 应 参数 是 一 个 int 类 型 。 


3) %f: 对 应 参数 是 一 个 double 类 型 。 


4) %ld: 对 应 参数 是 一 个 long int 类 型 。 


5) %s: 对 应 参数 是 一 个 const char* 类 型 ， 表 示 输 出 一 个 字符 串 。 


6) %u: 对 应 参数 是 一 个 unsigned in 


t 类 型 。 


7) %zu: 对 应 参数 是 一 个 size_t 类 型 。 


8) %td: 对 应 参数 是 一 个 ptrdiff_t 类 


型 。 


9) %x (或 %X) : 对 应 参数 是 一 个 int 类 型 ， 不 过 会 以 十 六 进 制 形 


式 输出 ， 其 中 大 于 9 的 数字 根据 字母 x 大 小 写 进行 转换 ， 如 果 是 %x， 则 
大 于 9 的 数 用 a~f 表 示 ; 如 果 是 %X， 则 用 A~ 下 表示 。 


10) %%: 输出 一 个 % 符 号 。 


各 位 可 以 在 目 己 的 计算 机 上 竹 试 编写 下 列 代码 ， 熟 悉 一 下 pritnf 函 


数 的 使 用 方式 : 


#include <stdio.h> 
#include <math.h> 


int main(int argc, const char * argv[]) 


int len = printf(" 你 好 \n"); 
printf(" 长 度 为 : %d\n"，1len); 


printf(" 输 出 字符 是 :%c， 输 出 浮 点 数 是 : %f\n"，'A'，M_PI); 


printf("100 的 十 六 进 制 数 为 : 69x%X\n"，100); 


const char *s = "hello, world!",; 
printf(" 儿 乎 .90% 会 出 现在 编程 语言 教科 书 上 的 字符 


是 : %s\n" 


, SS); 


各 位 可 以 编译 运行 上 述 代码 。 如 果 各 位 在 某 些 Unix/Linux 上 实 


， 没 有 中 文 输入 法 也 没有 关系 ， 可 以 用 相应 的 英文 来 代 闪 上述 中 
文 = 男 外 ; : 卡 述 字符 串 中 有 所 轩 现 的 nh 是 一 个 我 义 人 字符; 关于 转 义 学 
守 ， 我 们 将 在 5.1.6 节 中 加 以 描述 。 


4.6 ”本 章 小 结 


本 章 我 们 大 概 描述 了 C 语 言 构成 的 基本 元 素 。 一 开始 ， 我 们 列 出 
了 一 个 完整 的 C 语 言 源 文件 应 该 包含 的 几 个 部 分 。 然 后 我 们 提 到 了 C 语 
言 中 的 可 用 字符 集 以 及 各 类 符号 与 它们 的 定义 。 关 于 C 语 言 执 行 环境 
限制 的 更 多 详细 信息 可 参考 此 博文 : http://www.cnblogs.com/zenny- 


chen/p/4251813.html ° 
通过 本 章 学 习 ， 各 位 应 该 已 经 能 体会 到 C 语 言 书 写 的 大 致 格式 ， 


并 且 通 过 本 章 列 出 的 一 些 代码 片段 ， 目 己 能 试 试 身 手写 一 些 简 单 短小 
的 代码 出 来 ， 然 后 利用 printf 函 数 可 以 打印 出 一 些 计 算 结 采 。 


第 5 章 ”基本 数据 类 型 


本 章 将 介绍 C 语 言 中 的 基本 数据 类 型 以 及 相关 的 算术 有 逻辑 运算 。C 
语言 中 的 基本 数据 分 为 两 大 类 ， 一 类 是 整数 类 型 ， 男 一 类 是 浮 点 类 
型 。 整 数 类 型 还 包括 字符 类 型 以 及 布尔 类 型 。 浮 点 数 类 型 包括 单 精度 
浮 扣 数 、 双 精度 浮 点 数 以 及 扩展 双 精 度 浮 点 类 型 。 


对 任 一 整数 对 象 和 浮 点 数 对 象 ， 我 们 都 能 用 +、-、*、/ 对 它们 做 
加 、 城 、 乘 、 除 算术 运算 操作 ， 当 然 做 除法 时 除数 不 能 为 零 ， 人 否则 会 
导致 程序 运行 时 异常 。 另 外 ， 对 于 整数 之 间 的 操作 还 能 使 用 % ( 求 模 
操作 ) 进行 求 余数 ， 比 如 5%2 的 结果 为 1， 但 浮 点 数 之 间 不 能 进行 求 模 
操作 。 我 们 还 能 对 整数 做 按 位 操作 以 及 移 位 操作 ， 同 样 这 些 操 作 不 文 


持 浮 点 数 。 


5.1 整数 类 型 


C 语 言 中 整数 类 型 包括 int、short、long、long long、 布 尔 、 字 符 
除了 字符 与 布尔 类 型 以 外 ， 其 他 所 有 整数 类 型 都 支持 市 符号 与 无 
号 的 表示 方式 。 关 于 市 符号 与 无 符号 整数 类 型 的 表示 方式 可 以 参考 
第 2 章 的 内 容 。 此 外 ，C 语 言 标准 中 没有 明确 规定 每 一 种 整数 类 型 所 占 
用 的 字 节 数 ， 这 些 全 都 是 由 C 语 言 的 实现 来 定义 的 ， 但 是 C 语 言 标准 给 
了 若干 约束 ， 所 以 C 语 言 实现 应 该 至 少 能 满足 这 些 约 束 。 为 了 方便 叙 
述 ， 我 们 这 里 仍然 根据 主流 桌面 端 编译 器 (GCC、Clang) 以 及 主流 32 
位 与 64 位 处 理 需 环境 的 实现 进行 讲解 。 


慌 弗 


5.1.1 int 类 型 


用 关键 字 int 声 明 的 一 个 整数 对 象 具有 int 类 型 。 在 具体 的 C 语 言 执 
行 环境 中 ，int 数 据 的 最 小 值 与 最 大 值 分 别 定义 为 <limits.h> 头 文件 中 的 
INT_MIN 和 INT_MAX。 在 我 们 常用 的 32 位 与 64 位 环境 中 ，int 默 认为 
是 带 符号 的 (相当 于 signed int) ， 占 用 4 个 字 节 ( 即 32 位 ) ， 其 最 小 值 
为 -231 ( 即 0x80000000) ， 最 大 值 为 231-1 〈 即 0x7FFFFFFF) 。int 所 对 
应 的 无 符号 类 型 是 unsigned int， 通 常 在 32 位 与 64 位 环境 下 也 占用 4 个 字 


节 ， 最 小 值 为 0， 最 大 值 为 23?-1 ( 即 0xFFFFFFFF) 。 在 具体 C 语 言 执 
行 环境 中 的 最 大 值 定 义 为 <limits.h> 头 文件 中 的 UINT_MAX。 


int 类 型 对 应 的 整数 字面 量 可 直接 按照 自然 方式 书写 ， 比 如 
0、-128、127、+2233 等 都 默认 表示 为 int 类 型 。 此 外 ， 整 数字 面 量 可 以 
分 别 使 用 八进制 、 十 进 制 以 及 十 六 进 制 的 方式 进行 表达 。 八 进 制 的 整 
数字 面 量 表达 方式 为 以 0 打头 ， 比 如 : 01、023、-0477 这 些 都 是 属于 八 
进 制 整数 字面 量 。 而 十 六 进 制 整数 字面 量 则 是 以 0x 或 0X 打 头 ， 比 如 : 
0x123、-0x0045、0xabcdef 这 些 都 是 有 效 的 十 六 进 制 整数 字面 量 。 而 其 
他 没有 任何 前 绥 的 整数 字面 量 都 表示 为 十 进 制 整数 。 如 果 想 要 表达 一 
个 unsigned int 类 型 的 整数 字面 量 ， 可 在 一 般 整数 字面 量 后 直接 添加 字 
母 H 或 U。 本 书 习惯 上 使 用 大 写 的 U。 比 如 0U、01U、-128U、2048U、 
+2233U 等 都 属于 unsigned int 类 型 。 当 然 ， 即 便 字 面 量 后面 不 加 U 后 
级 ， 这 些 数 也 能 赋值 给 unsigned int 类 型 的 对 象 ， 因 为 它们 会 被 编译 器 
进行 默认 转换 。 此 外 ， 当 我 们 要 声明 一 个 unsigned int 类 型 的 对 象 时 ， 
int 可 以 省 略 。 比 如 ，unsigned a=0; ， 其 中 对 象 a 的 类 型 即 为 unsigned 
int 类 型 ，= 是 一 个 赋值 操作 符 (assignment operators) ， 将 其 右 操作 数 
0 赋值 给 左 操 作 数 a。 下面 举 一 些 例子 ， 各 位 也 可 以 在 自己 的 计算 机 上 
试 试 ， 如 代码 清单 5-1 所 示 。 


代码 清单 5-1 int 类 型 介绍 


#include <stdio.h> 
#include <limits.h> 


int main(int argc, const char * argv[]) 


int a = 10; | // 声明 了 int 类 型 对 象 a， 将 整数 10 赋 值 给 它 
// 以 下 语句 声明 了 unsigned int 类 型 对 象 b， 将 整数 100 赋 值 给 它 
unsigned int b = +100U 


unsigned c = -1U; // 声明 了 unsigned int 类 型 对 象 c 

printf("a + b = %d\n", a + b); // 这 里 a+b 的 结果 为 110 

printf("c = Ox%X\n", c); // 这 里 ，c 为 9xFFFFFFFF 

printf("a + c = %d\n", a + c); // 这 里 加 法 结果 溢出 ， 但 可 将 它 看 作为 10-1 的 结果 


a = QOx7FFFFFFF; 
a += 1; // a += 1 相当 于 a = a +1 


于 0x80000000 


前 C 语 言 实现 下 int 类 型 的 最 小 值 
前 C 语 言 实现 下 int 类 型 的 最 大 值 


学 | 
printf("a = %d\n"，a);// 加 法 结果 湾 出 ， 结 果 为 -2147483648， 相 当 


printf("INT_MIN 
printf("INT_MAX 


%d\n"，INT_MIN); // 查看 
%d\n"，INT_MAX); // 查看 


FA 


// 查看 当前 C 语 言 实 现下 unsigned int 类 型 的 最 大 值 
// 由 于 unsigned int 的 最 小 值 已 被 标准 定义 为 0 
printf("UINT MAX = %u\n", UINT_MAX); 


这 里 顺便 再 提 一 下 ， 根 据 C 语 言 标准 ， 我 们 在 一 个 C 语 言 源 文件 的 
末尾 处 最 好 添加 一 个 换行 符 ， 并 且 不 再 添加 任何 其 他 的 空 日 符 。 在 茶 
些 老 版 本 的 GCC 上 (比如 3.x 版 本 ) ， 如 果 源 文件 末 不 是 以 换行 符 结 
尾 ， 则 GCC 编 译 胡 在 编译 后 会 有 敬告， 要 求 在 源 文件 末尾 处 添加 一 个 


上 上 述 代 码 已 经 涉及 了 很 多 额外 的 知识 ， 比 如 加 减法 运算 结 末 次 出 
的 行为 ， 还 有 += 操 作 符 的 意义 等 。 由 于 这 些 知 识 比 较 简单 易 懂 ， 所 以 
我 们 束 不 在 正文 中 加 以 到 述 ， 而 直接 以 代码 注释 的 方式 给 出 。 各 位 在 
目 己 的 计算 机 上 编译 运行 后 目 然 束 能 知晓 其 用 途 。 当 然 ， 各 位 在 融 上 
述 代 码 的 时 候 ， 注 释 部 分 /以 及 其 后 面 的 文字 ) 不 需要 打出 来 ， 这 
些 仅仅 是 对 代码 的 注解 ， 对 程序 本 身 没 有 其 他 作用 。 


5.1.2 ”short 类 型 


short 类 型 (标准 表达 为 signed short int 类 型 ， 其 中 signed 与 int 均 可 
省 略 ) 我 们 一 般 称 之 为 短 整 型 。 在 我 们 通常 的 32 位 及 64 位 系统 下 占用 2 
个 字 节 ( 即 16 位 ) ， 其 最 小 值 为 -25 ( 即 0x8000) ， 最 大 值 为 215-1 

( 即 0x7FFF) 。 在 C 语 言 执行 环境 下 ， 其 最 大 、 最 小 值 分 别 定义 为 
<limits.h> 头 文件 中 的 SHRT_MAX 和 SHRT_MIN 。short 类 型 所 对 应 的 无 
符号 类 型 为 unsigned short (标准 表达 为 unsigned short int， 其 中 int 可 
省 ) 。 它 通常 在 32 位 及 64 位 系统 下 占 2 个 字 节 ， 最 小 值 为 0， 最 大 值 为 
216-1 ( 即 0xFFFF) 。 在 C 语 言 执 行 环境 中 ， 其 最 大 值 定 义 为 <limits.h> 
头 文件 中 的 USHRT_MAX 。 


short 类 型 与 unsigned short 类 型 没有 特别 对 应 的 整数 字面 量 ， 它 们 
可 直接 用 int 与 unsigned int 相 应 的 整数 字面 量 进行 赋值 ， 如 代码 清单 5-2 
所 示 的 用 法 。 


代码 清单 5-2 short 类 型 介绍 


#include <stdio.h> 
#include <limits.h> 


int main(int argc, const char * argv[]) 
// 这 里 同时 声明 了 short 类 型 对 象 a 和 b 


// 将 a 赋值 为 190， b 赋 值 为 200 
Short a = 100, b = 200,; 


printf("a - b = %d\n", a - b); 


// 这 里 声明 了 unsigned short 类 型 的 对 象 c 
unsigned short c = 100; 


c -= 200; // 相当 于 c = c - 200; 


printf("c = %hu\n", c); // 结果 为 65436 ( 即 65536 - 100) 


printf("SHRT_MIN = %d\n"，SHRT_MIN);// 查看 当前 C 语 言 实现 下 short 类 型 的 最 小 值 
printf("SHRT_MAX = %d\n"，SHRT_MAX);// 查看 当前 Cc 语 言 实现 下 short 类 型 的 最 大 值 


// 查看 当前 C 语 言 实现 下 unsigned short 类 型 的 最 大 值 
// 由 于 unsigned short 的 最 小 值 已 被 标准 定义 为 0 
printf("USHRT_MAX = %u\n", USHRT_MAX); 


代码 清单 5-2 中 ， 字 符 串 格式 符 %hu 对 应 一 个 unsigned short 类 型 的 
参数 。65536 表 示 为 22。 这 里 表述 了 第 2 章 介绍 的 概念 ， 即 如 何 将 一 个 
带 符 号 整数 〈 补 码 形式 ) 转 为 无 符号 整数 的 表示 形式 。 


5.1.3 ”long 类 型 


long 类 型 (标准 表达 为 signed long int 类 型 ， 其 中 signed 与 int 均 可 省 
略 ) 我 们 一 般 称 之 为 长 整 型 。 在 我 们 通常 的 32 位 环境 下 long 类 型 占用 4 
个 字 节 《〈 即 32 位 ) ， 而 在 64 位 系统 下 ， 当 前 儿 个 主流 桌面 编译 器 就 有 
所 区 别 了 。MSVC 与 VS-Clang 仍 然 为 4 个 字 节 ， 而 GCC 与 Clang 则 是 8 个 
字 市 〈 即 64 位 ) 。long 类 型 所 对 应 的 无 符号 类 型 为 nsigned long (标准 
表达 为 unsigned long int，int 可 省 ) ， 我 们 一 般 称 之 为 无 符号 长 整 型 ， 
它 的 字 贡 长 度 与 jong 类 型 一 致 。 在 C 语 言 执 行 环 境 中 ，long 类 型 的 最 小 
值 与 最 大 值 分 别 定义 为 <limits.h> 头 文件 中 的 LONG_MIN 与 
LONG_MAX。unsigned long 类 型 的 最 大 值 定 义 为 <limits.h> 头 文件 中 的 


ULONG_MAX， 其 最 小 值 为 0。 


long 类 型 对 应 的 整数 字面 量 是 在 int 整 数字 面 量 后 面 加 上 英文 字母 1 
或 L， 本 书 都 用 大 写字 母 L 作 为 后 弘 。unsigned long 对 应 的 整数 字面 量 
征 在 unsigned int 字 面 量 后 面 加 上 字母 或 L， 本 书 采 用 的 部 是 以 UL 作为 
后 级。 一 般 情况 下 ， 我 们 直接 用 int 字 面 量 赋值 给 long 类 型 的 变量 也 不 
会 有 问题 ， 但 是 当 我 们 要 表达 一 个 超出 int 范 围 的 整数 时 ， 我 们 整 得 加 
上 后 缀 L， 否 则 数据 可 能 会 被 截断 。 不 过 这 里 ， 不 同 的 编译 万 会 有 不 
同行 为 。 如 代码 清单 5-3 所 示 的 例子 。 


代码 清单 5-3 ”long 类 型 介绍 


#include <stdio.h> 
#include <limits.h> 


int main(int argc, const char * argv[]) 


long a = 100; // 声明 了 long 类 型 对 象 a， 并 给 它 赋值 为 
100 

// a 一 般 int 的 范围 a 

// 所 以 我 们 在 下 加 - 1 表示 一 个 long 类 型 的 字面 量 We 

// 僧 若 不 加 后 组 企 某 些 编译 器 上 会 出 现 警 告 ， 在 运行 时 也 可 能 出 现 数据 被 截断 的 情况 


long b = GX106060000L; 


// 这 里 用 %1d 表 示 对 应 一 个 long 类 型 的 参数 
printf("a + b = %ld\n", a + b); 


// 声明 一 个 unsigned long 类 型 对 象 c i 
// 109UL 即 表示 一 个 unsigned long 的 整数 字面 量 
unsigned long c = 100UL; 


// 声明 一 个 unsigned long 类 型 对 象 d 
// 1090900 表 示 一 个 int 类 型 的 整数 字面 昌 
// 但 由 于 unsigned long 的 精度 至 少 不 小 于 int 类 型 的 精度 ， 
// 所 以 int 可 以 隐 式 转 为 unsigned “ong 类 型 
unsigned long d = 1000000; 


// 这 里 用 %1Lu 表 示 对 应 一 个 unsigned long 类 型 的 参数 
printf(nc * d= %lu\n", c * d) 


了 


printf("LONG_MIN 
printf("LONG_MIN 


%ld\n"，LONG_MIN);// 查看 当前 C 语 言 实 现下 1ong 类 型 的 最 小 值 
%ld\n"，LONG_MAX);// 查看 当前 C 语 言 实现 下 Long 类 型 的 最 大 值 


// 查看 当前 C 语 言 实 现下 unsigned long 类 型 的 最 大 值 
// 由 于 unsigned long 的 最 小 值 已 被 标准 定义 为 0 
printf("ULONG_ MAX = %lu\n", ULONG MAX); 


对 于 代码 清单 5-3， 我 们 最 好 在 64 位 的 Linux 或 macOS (或 
FreeBSD) 下 用 GCC 或 Clang 编 译 器 编译 运行 ， 因 为 在 Windows 64 位 下 
用 MSVC 或 MS-Clang 编 译 器 的 话 ，long 类 型 仍然 占 4 个 字 节 ， 看 不 到 某 
些 效 果 ， 除 非 使 用 MingW-W64 或 64 位 的 Clang 编 译 器 。 


不 过 ， 正 因为 long 和 unsigned long 在 不 同 环境 下 字 世 长 度 不 同 ， 所 
以 我 们 在 定义 一 个 整数 对 象 时 应 当 尽 量 避 人 免 使 用 long 类 型 ， 除 非 涉及 
系统 相关 的 一 些 属 性 。 比 如 C 语 言 标准 库 中 将 获取 文件 当前 位 置 
(ftell) 等 函数 的 返回 类 型 作为 long 类 型 。 但 对 于 一 般 应 用 程序 而 言 ， 
我 们 需要 慎 用 long 类 型 。 


5.1.4 ”long long 类 型 


C 语 言 标准 对 long long (标准 表达 为 signed long long int， 其 中 
signed 与 int 可 省 ) 类 型 提 得 不 多 ， 仅 仅 前 述 了 long long 类 型 的 精度 至 少 
为 long int 类 型 的 精度 。 不 过 在 当前 儿 大 主流 桌面 编译 伙 中 ， 无 论 是 32 
位 系统 还 是 64 位 系统 ，long long 的 宽度 均 为 8 个 字 市 〈 即 64 位 ) 。 其 最 
小 值 为 -2638， 最 大 值 为 263-1。long long 对 应 的 无 符号 类 型 为 unsigned 
long long (标准 表达 为 unsigned long long int，int 可 省 ) ， 同 样 也 是 8 字 
忆 的 宽度 ， 最 小 值 为 0， 最 大 值 为 2%4-1。 在 C 语 言 执 行 环 境 下 ，long 
long 的 最 小 值 与 最 大 值 分 别 定义 为 <limits.h> 头 文件 中 的 LLONG_MIN 


与 LLONG_MAX。unsigned long long 类 型 的 最 大 值 定 义 为 <limits.h> 头 
文件 中 的 ULLONG_MAX。 


long long 对 应 的 整数 字面 量 表示 为 int 整 数字 面 量 后 加 后 绥 ]] 或 
LL， 本 书 采 用 LL 后 级。unsigned long long 对 应 的 整数 字面 量 表示 为 
unsigned int 整 数字 面 量 后 面 加 后 级 ll 或 LL， 本 书 采用 ULL 作 为 后 级。 
参见 代码 清单 5-4。 


代码 清单 5-4 ”long long 类 型 介绍 


#include <stdio.h> 
#include <limits.h> 


int main(int argc, const char * argv[]) 


{ 


long long a = 100; // 声明 了 long long 类 型 对 象 4， 并 给 它 赋值 为 100 


// 这 里 9x100060699 已 经 超出 了 一 般 int 的 范 昌 加 
// 所 以 我 们 在 它 后 面 加 上 后 组 LL， 表示 一 个 long long 类 型 的 字 硬 量 


门 呈 
long long b = Ox100000000LL; 


utr 


// 这 里 用 %11d 表 示 对 应 一 个 long long 类 型 的 参数 
printf("a + b = %lld\n", a + b); 


y 声明 一 个 unsigned long Long 类 型 对 象 c 
// 100ULL 即 表示 一 个 unsigned long long 的 整数 字面 量 
unsigned long long c = 100ULL,; 


// 声明 一 个 unsigned long long 类 型 对 象 d 
// 1990690 表 示 一 个 nt 类 型 的 整数 字面 量 
// 但 由 于 -unsioned long 1long 的 精度 至 少 不 小 于 int 类 型 的 精度 ， 
// 所 以 int 可 以 隐 式 转 为 unsigned long long 类 型 
unsigned long long d = 1000000; 


// 这 里 用 %11u 表 示 对 应 一 个 unsigned long long 类 型 的 参数 


printf("c * d = %llu\n", c * d); 


// 全 看 
printf 


当前 Cc 语言 实现 
("LLONG_MIN 


long long3 
= %lld\n", 


当前 C 语 言 实现 
("LLONG_MAX 


long long 
= %lld\n", 


当前 Cc 语言 实现 


类 型 的 最 小 


填 
LLONG_MIN); 


型 的 最 大 值 
LLONG_MAX); 


unsigned long long 类 型 的 最 大 值 


Funsigned long long 的 最 小 值 已 被 标准 


定义 为 9 


printf("ULLONG MAX = %llu\n", ULLONG MAX); 


5.1.5 布尔 类 型 


在 计算 机 编程 语言 中 ， 布 尔 类 型 的 对 象 是 一 个 二 值 数据 对 象 。 布 
尔 类 型 用 于 表达 真 假 逻辑 关系 ， 一 般 用 true 表 示 真 ，false 表 示 假 。 广 生 
布尔 值 的 表达 式 称 为 逻辑 表达 式 或 关系 表达 式 比如， 大于、 等 于 、 
小 于 、 不 等 于 等 关系 操作 的 结果 ) 。 在 C11 标 准 中 ， 布 尔 类 型 用 关键 
字 _Bool 声 明 ， 并 说 明 布 尔 类 型 只 要 能 够 存放 0 和 1 值 环行 ， 也 就 是 至 少 
为 1 个 比特 。 所 以 现在 大 部 分 对 _Bool 的 C 语 言 实现 都 将 它 作 为 1 个 字 节 
的 宽度 。 此 外 ，_Bool 类 型 不 能 用 signed 和 unsigned 来 修饰 。 


在 C 语 言 刚 被 创建 的 时 候 ， 它 并 不 具备 “布尔 类 型 "这 个 概念 ， 而 
仅仅 用 0 ( 浮 点 数 则 为 0.0) 与 对 象 比较 来 判定 真 假 。 如 果 对 象 的 值 等 
于 零 ， 那 么 表示 “ 假 ”>， 否 则 表示 “ 真 ”。 所 以 ， 即 便 从 C99 开 始 引 入 了 
_Bool 布 尔 类 型 ， 之 前 的 这 个 约定 依然 沿用 。 为 了 能 与 C++ 兼容 ，C 语 
言 从 C99 标 准 开始 就 引入 了 <stdbool.h> 头 文件 ， 里 面 用 bool 这 个 宏 来 定 
义 _Bool， 用 true 定 义 为 1，false 定 义 为 0。bool、true 以 及 false 都 不 属于 
C 语 言 中 的 关键 字 ， 它 们 仅 属 于 标准 库 中 定义 的 类 型 和 常量 。 在 C11 标 
准 的 语言 核心 中 ， 依 然 只 定义 了 _Bool 这 个 关键 字 表示 布尔 类 型 ， 而 没 
有 定义 真 值 和 假 值 的 字面 量 。 所 以 ， 我 们 在 使 用 布尔 类 型 的 对 象 时 ， 
最 好 引入 <stdbool.h> 头 文件 ， 然 后 用 bool 定 义 布尔 类 型 对 象 ， 用 true 表 
示 真 值 常量 ，false 表 示 假 值 常量 。 下 面 我 们 举 一 些 例子 来 说 明 。 


代码 清单 5-5 ”布尔 类 型 介绍 


#include <stdio.h> 
#include <stdbool.h> 


int main(int argc, const char * argv[]) 


// 声明 了 一 个 布尔 类 型 的 对 象 a， 并 将 它 初 始 化 为 真 
bool a = true 


// 声明 了 一 个 布尔 对 象 b， 并 将 它 初始 化 为 假 
bool b = false; 


// 声明 了 一 个 布尔 对 象 c<， 并 用 a 与 b 是 否 相 等 的 比较 结果 对 它 初 始 化 
bovl .6 = a == bs // 这 里 c 为 假 
printf("c = %d\n", c); // 输出 c = 0 
c=a!=b; // 用 a != b (a 不 等 于 b) 的 比较 结果 给 对 象 c 
printf("al=b 的 结果 : %d\n"，c); // 输出 1 

c = 10 > 5， 

printf("10 > 5? %d\n", c); // 输出 1 
c=10<5; 

printf("10 < 5? %d\n", c); // 输出 0 

a = 0X10000000 ; 

printf("a = %d\n", a); // 输出 1 

b= 0.0; 

printf("b = %d\n", b); // 输出 0 


// 输出 _Boo1 数 据 对 象 类 型 的 宽度 
printf("_Bool type size is: %zu\n", sizeof(_Bool)); 


在 代码 清单 5-5 中 ， 我 们 用 GCC 或 Clang 编 译 器 编译 之 后 能 发 现 ， 
_Bool 类 型 的 对 象 只 占用 一 个 字 广 。 男 外 ， 对 于 a=0x10000000，a 的 值 
不 是 简单 地 对 0x10000000 进 行 高 位 截断 ， 只 取 最 低 1 个 字 市 获得 结 
而 是 相当 于 将 0x100000001 =0 的 结果 给 了 布尔 对 象 a。 同样 ， 下 面 的 
b=0.0 也 不 是 说 就 把 0.0 这 个 双 精 度 浮 点 数 赋值 给 布尔 对 象 b， 而 是 把 
0.0! =0.0 的 结果 赋值 给 布尔 对 象 b。 这 些 都 会 由 C 语 言 编译 器 自动 转换 
处 理 。 


5.1.6 ”字符 类 型 


C 语 言 中 用 关键 字 char 来 声明 一 个 字符 类 型 。C11 标 准 前 明 了 一 个 
char 类 型 的 对 象 必须 至 少 能 存放 基本 执行 字符 集 ， 并 且 如 有 果 一 个 基本 
执行 字符 存放 在 一 个 char 类 型 的 对 象 中 的 话 ， 那 么 该 char 类 型 的 对 象 的 
值 必 须 保 证 为 非 负 整数 。 所 以 ， 通 常 C 语 言 的 实现 都 会 将 char 类 型 的 宽 
度 设置 为 一 个 字 刘 ， 这 样 正好 至 少 能 存放 ASCII 码 字符 集 。 


这 里 各 位 需要 当心 的 是 ， 有 些 编译 器 会 默认 将 char 类 型 设 定 为 无 
符号 的 ， 即 char 类 型 的 整数 是 一 个 无 符号 的 8 位 整数 。 所 以 ， 我 们 如 果 
要 用 char 类 型 定义 一 个 市 符号 的 8 位 整数 ， 需 要 显 式 地 使 用 signed 
char， 这 里 signed 不 应 该 被 省 略 。 如 果 要 声明 一 个 无 符号 8 位 整数 ， 则 
使 用 unsigned char。C11 标 准 明 确 指出 ，char、signed char 与 unsigned 
char 统 称 为 字符 类 型 ， 但 三 者 在 类 型 上 是 不 兼容 的 ， 尽 管 char 在 数值 表 
示范 围 上 可 能 与 unsigned char 相 同 ， 或 与 signed char 相 同 。 因 此 如 前 所 
述 ， 我 们 在 编写 程序 的 时 候 ， 用 signed char 来 指定 8 位 带 符 号 整数 ; 
unsigned char 来 指定 无 符号 8 位 整数 ， char 用 于 指定 一 个 基本 字符 对 
象 。signed char 的 最 大 、 最 小 值 分 别 定义 为 <limits.h> 中 的 
SCHAR_MAX 与 SCHAR_MIN 。unsigned char 的 最 大 值 定义 为 
<limits.h> 中 的 UCHAR_MAX， 最 小 值 为 0。 char 的 最 大 、 最 小 值 分 别 
定义 为 <limits.h> 中 的 CHAR_MAX 和 CHAR_MIN。 


8 位 市 符号 与 无 符号 的 整数 字面 量 没有 特定 的 字面 量 表示 方式 ， 直 
接 用 int 与 unsigned int 类 型 的 整数 字面 量 即 可 。 而 字符 字面 量 则 是 用 单 
引号 ， 里 面包 含 一 个 或 多 个 字符 。 比 如 'a、'123' 都 是 有 效 的 字符 字面 
量 。C11 标 准 明 确 规定 ， 一 个 字符 字面 量具 有 int 类 型 ， 如 有 果 将 一 个 字 
符 字 面 量 赋值 给 一 个 char 类 型 的 对 象 ， 那 么 将 该 字符 字面 量 的 最 低 有 
效 位 赋值 给 它 ， 比 如 在 我 们 通常 的 执行 环境 中 束 是 将 字符 字面 量 的 最 
低 字 市 赋值 给 char 类 型 的 对 象 。 


在 C 语 言 中 ， 不 是 所 有 的 字符 字面 量 都 能 回 显 在 文本 编辑 左 中 ，， 
另外 还 有 一 些 字 符 具 有 特殊 作用 ， 比 如 换行 、 制 表 符 等 ， 而 且 像 单 引 
写本 身 也 表示 一 个 字符 字面 量 的 开头 或 结尾 ， 所 以 对 于 这 些 特殊 字 
符 ， 我 们 通过 使 用 转 义 字符 的 方式 来 表示 它们 。 下 面 列 举 一 下 C 语 言 
和 李 义 他 他 8 


1) 单 引 号 : 用 \。 
2) 双 3 引 号 :用 \"。 


3) 问号 : 用 \? ， 不 过 一 般 我 们 可 以 直接 使 用 '? '， 无 需 使 用 此 转 


4) 倒 斜 杠 \: 用 \。 


5) 用 八进制 编码 表示 的 一 个 字符 : \ 后 面 紧 跟 1 到 3 个 八进制 数 。 
比如 : \7、\12、\123 等 。 


6) 用 十 六 进 制 编码 表示 一 个 字符 : Wx 后 面 跟 一 个 十 六 进 制 数 。 比 
如 : \x0a、\x30 等 。 


Oj 后 面 所 眼 的 所 有 能 有 效 表示 为 十 六 浊 制 数 的 字 答 
( 即 0~~9， 大 写字 母 A~F 以 及 小 写字 母 a~f) 都 作为 当前 单个 十 六 进 
制 编码 的 字符 ， 直 到 过 到 无 法 有 效 表示 十 六 进 制 数 的 字符 为 止 。 男 
外 ， 如 果 \x 后 面 不 是 紧 跟 一 个 有 效 的 十 六 进 制 字符 ， 那 么 编译 器 将 会 
报错 。 所 以 x 后 必须 至 少 跟 一 个 有 效 的 十 六 进 制 字符 。 


< 


7) \a: 表示 报警 。 该 字符 会 产生 一 个 可 听 到 的 或 可 见 到 的 警报 ， 
但 不 改变 当前 的 游标 位 置 。 


8) \b: 表示 回 退 。 该 字符 将 当前 游标 移动 到 当前 行 的 前 一 个 位 


置 。 


< 


9) \f: 表示 换 页 。 该 字符 将 当前 游标 移动 到 下 一 个 逻辑 页 的 初始 
位 站 


10) \n: 表示 换行 。 该 字符 将 当前 游标 移动 到 下 一 行 的 初始 位 
置 O 


11) YY: 表示 回 车 。 该 字符 将 当前 游标 移动 到 当前 行 的 初始 位 
署 。 


12) \t 表示 水 平 制 表 符 。 该 字符 将 当前 游标 移动 到 当前 行 的 下 
一 个 水 平 表格 单元 位 置 。 


13) \V: 表示 垂直 制 表 符 。 该 字符 将 当前 游标 移动 到 下 一 垂直 表 
格 单元 位 置 的 初始 位 置 。 


14) \0: 表示 空 。 值 为 0 的 字符 在 C 语 言 中 一 般 用 于 字符 串 的 结束 
和 人 符 。C 语 言 标准 库 中 的 很 多 库 函 数 都 以 \0 子 符 作为 一 个 字符 串 末 尾 的 判 
断 依据 。 


下 面 我 们 将 举 一 些 例子 来 朱 述 这 些 字符 类 型 及 其 使 用 方法 。 


代码 清单 5-6 ”字符 类 型 介绍 


#include <stdio.h> 
#include <limits.h> 


int main(int argc, const char * argv[]) 


signed char a = 100; // 声明 了 一 个 带 符号 8 位 整数 对 象 a 
signed char b = -10; // 声明 了 一 个 带 符号 8 位 整数 对 象 b 
printf("a - b = %d\n", a - b); // 结果 输出 110 

unsigned char c = 200; // 声明 了 一 个 无 符号 8 位 整数 对 象 c 
unsigned char d = 50; // 声明 了 一 个 无 符号 8 位 整数 对 象 d 
printf("c - d = %d\n", c - d); // 输出 结果 150 


// 输出 signed char 的 最 小 值 
printf("SCHAR MIN = %d\n", SCHAR_MIN); 


// 输出 signed char 的 最 大 值 
printf("SCHAR_MAX = %d\n", SCHAR_MAX); 


// 输出 unsigned char 的 最 大 值 
printf("UCHAR_ MAX = %d\n", UCHAR_ MAX); 


char 过 PS a's // 声明 一 个 字符 对 象 ch， 字符 'a' 对 它 初 始 化 
printf("ch = %c\n", ch); // 输出 a 

// 对 于 多 字符 的 字符 字面 量 ， 某 些 编译 器 会 给 出 警告 

// 这 里 会 将 int 类 型 的 字符 字面 量 ' abc ' 截取 其 最 低 字 节 'c ' 给 对 象 ch 


// 其 他 高 字 节 部 分 被 舍弃 
ch = "abc'， 


printf("ch = %c\n", ch); // 输出 c 
// 这 里 不 会 有 警告 ， 
// 字符 a 位 于 对 象 s 的 最 低 字 节 位 置 ， 字 符 \0 位 于 对 象 s 的 最 高 字 节 位 


int s = '\Qcba'; 
printf("s = %s\n"，(char*)&s); // 输出 abc 


// 八进制 数 060 相 当 于 十 六 进 制 数 0x30， 对 应 于 ASCII 码 的 罗马 数字 0 


ch = '\060'， 

printf("ch = %c\n", ch); // 输出 0 

// 八进制 数 0101 相 当 于 十 六 进 制 数 0x41， 对 应 于 ASCII 码 的 大 写字 母 A 

ch = '\101'，; 

printf("ch = %c\n", ch); // 输出 A 

ch = '\x42'; // 十 六 进 制 数 0x42 对 应 于 ASCII 码 中 的 大 
写字 母 B 

printf("ch = %c\n", ch); // 输出 B 


// 无 效 的 转 义 符 ， 在 Clang 中 此 时 ch 的 值 为 '8， 
// 因为 八进制 数 中 的 每 一 位 数 都 是 在 0 到 7 的 范围 内 
ch = '\8',，; 


// 无 效 的 转 义 符 ， 在 Clang 编 译 器 中 直接 编译 报错 
// 因为 字母 g 不 是 一 个 能 表达 十 六 进 制 数 的 有 效 字符 
ch = '\xg0'; 


// 输出 char 类 型 的 最 小 值 
printf("CHAR MIN = %d\n", CHAR_MIN); 


// 输出 char 类 型 的 最 大 值 
printf("CHAR MAX = %d\n", CHAR_MAX); 


代码 清单 5-6 中 ， 对 于 printf ("s=%s\n"， (char*) &s) ; 这 条 代 
码 我 们 用 到 了 投射 操作 与 指针 的 概念 ， 这 些 知 识 稍 后 会 做 详细 介绍 。 
这 里 仅仅 给 大 家 阐明 多 字 市 字符 字面 量 赋值 给 一 个 int 对 象 后 ， 其 在 小 
端 模式 下 存储 数据 的 方式 。 说 到 这 里 ， 聪 明 的 读者 可 能 会 有 这 人 么 一 
问题 : 因为 \060' 表 示 的 是 一 个 八进制 数 ， 如 果 想 要 表达 
{\0'，'4'，'3'，'2} 这 么 一 个 多 字 市 字符 该 怎么 做 呢 ? 因 为 \043' 本 号 是 
一 个 有 效 的 八进制 转 义 字符 ， 对 应 于 十 六 进 制 数 0x23， 在 ASCII 码 表 


中 对 应 于 # 字 符 。 所 以 \0432' 相 当 于 和 #2'。 此 时 ， 我 们 能 想到 的 是 ， 对 于 
一 个 八进制 转 义 字符 ， 在 \ 后 面 最 多 只 能 跟 3 个 八进制 数 ， 所 以 我 们 过 
性 将 \0 写 作为 \000 即 可 解决 这 个 问题 。 当 然 ， 我 们 也 可 以 分 别 将 后 面 
的 三 个 字符 4 、'3'、'2' 分 别 用 八进制 或 十 六 进 制 转 义 字符 来 代 蔡 。 我 
们 可 以 实践 一 下 以 下 代码 : 


#include <stdio.h> 
int main(int argc, const char * argv[]) 
// 这 里 s 的 值 相当 于 '\Q#21' 


int s = '\x0\0432'，; 
printf("s = %s\n"，(char*)&s); // 输出 


D 


# 


// 这 里 s 的 值 相当 于 最 高 字 节 为 字符 '\01' 

// 低 三 个 字 节 依次 为 '432 

s = '\000432'， 

printf("s = %s\n"，(char*)&s); // 输出 234 


// 或 者 可 以 这 么 写 
S = '\0\x34\x33\x32',， 
printf("s = %s\n"，(char*)&s); // 输出 234 


5.1.7” 视 字符 以 及 Unicode 字 符 类 型 


从 C99 标 准 中 引入 了 wchar t 类 型 来 表示 一 个 多 字 世 字符 。wchar { 
并 不 是 C 语 言 的 一 个 关键 字 ， 而 是 定义 在 <stddef.h> 头 文件 中 的 一 个 宏 
类 型 。wchar t 类 型 在 不 同 环境 ， 其 长 度 也 可 能 不 一 样 ，C 语 言 标 准 没 
有 规定 它 必 须 占用 多 少 字 方 。 当 前 编译 器 一 般 将 wchar_t 定 义 为 4 个 字 
节 的 宽度 ， 有 些 老 的 编译 器 可 能 为 2 个 字 节 。 宽 字符 的 字面 量 为 一 般 字 
符 字 面 量 前 加 大 写字 母 L 前 级 ， 这 里 各 位 要 注意 ， 必 须 是 大 写字 和 母 ， 


不 能 是 小 写 的 。 比 如 ，L'a、 工 你 ' 等 都 属于 wchar t 类 型 的 宽 字 符 字 面 
量 。 宽 字符 在 C 语 言 中 的 定义 比较 模糊 ， 它 主要 根据 当前 系统 的 语言 
环境 设置 ， 可 能 是 UTF-16 编 码 、GB2312、 拉 丁 系 编码 格式 等 。 宽 字 
符 在 不 同 语言 环境 下 ， 其 相应 的 所 显示 出 来 的 字样 都 可 能 会 不 同 。 由 
此 ，C 语 言 标 准 组 织 在 C11 标 准 中 引入 了 Unicode 字 符 类 型 。 


C11 中 主要 引入 了 UTF-8 字 符 串 、UTF-16 字 符 以 及 字符 串 类 型 和 
UTF-32 字 符 及 字符 串 类 型 。 正 如 在 2.6 节 所 描述 的 ，UTF-8 编 码 的 长 度 
范围 为 1~4 个 字 节 ， 所 以 在 C 语 言 中 可 以 直接 用 char 类 型 来 表示 当前 一 
个 UTF-8 编 码 字 符 的 一 个 字 节 ， 它 已 经 涵盖 了 基本 的 ASCII 码 。 如 果 要 
表示 中 文 、 日 文 等 UTF-8 字 符 的 话 ， 则 需要 使 用 字 市 数组 。C11 中 ， 引 
入 了 新 的 头 文 件 <uchar.h>， 其 中 定义 了 UTF-16 字 符 类 型 ----char16_t 以 
及 UTF-32 字 符 类 型 ----char32_t。 不 过 C 语 言 标 准 委 员 会 做 得 非常 灵 
活 ， 在 标准 中 提 到 ， 当 C 语 言 编 译作 预 完 定义 了 __STDC_UTF_16_ 这 
个 宏 时 ，char16_t 才 保证 被 用 作为 UTF-16 编 码 ; 当 预 先 定义 了 
”STDC_UTEF 32 ”这 个 宏 时 ，char32_t 才 保证 被 用 作为 UTF-32 编 码 ; 
否则 char16_t 和 char32_t 可 能 会 留 作 其 他 字符 编码 类 型 使 用 。 在 C11 
中 ，UTF-16 的 字面 量 是 在 普通 字符 字面 量 前 加 小 写字 母 u， 比 如 ua'、 
u' 我 ' 等 都 是 UTF-16 字 符 字 面 量 ; UTF-32 的 字面 量 是 在 普通 字符 字面 量 
前 加 大 写字 母 U， 比 如 Ub'、U 好 ' 等 都 是 UTF-32 字 符 字 面 量 。 同 样 ， 
C11 标 准 没有 明确 提 到 char16_t 与 char32_t 的 宽度 ， 现 在 编译 器 一 般 将 


char16_t 定 义 为 unsigned short 类 型 ， 占 2 个 字 节 ; 将 char32_t 定 义 为 


unsigned int 类 型 ， 占 4 个 字 及 。 
鉴于 现在 UTF-8 和 UTF-16 都 用 得 非常 普 裔 ， 我 们 将 在 以 下 代码 例 


子 中 简单 描述 一 下 宽 字 符 以 及 UTF16 字 符 和 UTF-8 字 符 串 的 使 用 如 代 
码 清单 5-7 所 示 。 而 关于 字符 串 ， 我 们 将 在 7.10 节 做 详细 摘 述 。 


代码 清单 5-7” 宽 字符 与 Unicode 字 符 介 绍 


#include <stdio.h> 
#include <uchar.h> 
#include "zenny_utftrans.h" 


int main(int argc, const char * argv[]) 


// 定义 了 一 个 长 度 为 32 个 字 节 的 char 数 组 
// 这 里 后 面 用 于 存放 UTF-8 多 字 节 字符 


吉本 
char buffer[32]; 


// 声明 了 一 个 wchar_t 类 型 的 对 象 a 
wchar_t a = 上 ' 你 '， 


// 声明 了 一 个 UTF-16 变 量 utf16Char 
char16 utf16Char = u' 好 '，; 


// 在 utf16Str 数 组 中 依次 存放 a 中 的 宽 字 符 、utf16Char 的 UTF-16 字 符 
// 以 及 u'\0' 表 示 UTF-16 字 符 串 的 终结 符 
char16 utf1i6Str[] = { a, utfi6Char, u'\0'" }; 


ZennyUTF16TOoUTF8(buffer, utfi6Str, NULL); 


printf(u8" 字 符 串 为 : %s\n"，buffer); 


printf("wchar_t 宽 度 为 : %zu\n"，sizeof(a)); 


各 位 需要 注意 的 是 ， 头 文件 <ucharh> 尚 未 包含 在 macOS 等 部 分 
Unix 系 统 中 ， 所 以 我 们 用 unsigned short 来 代替 char16 {t， 或 者 我 们 可 以 
用 代码 清单 5-8 的 代码 自己 建 一 个 uchar.h 头 文件 。 而 在 Windows 系 统 中 
倒是 已 经 包含 了 ， 各 位 可 以 在 VS-Clang、MinGW 等 编译 器 中 直接 使 


用 。 不 过 无 论 在 哪 种 系统 环境 下 ，GCC 和 Clang 编 译 器 对 UTF-16 以 及 
UTF-32 字 人 符 的 字面 量 都 已 经 文 持 。 


代码 清单 5-8 ”一 个 简单 的 ucharh 头 文件 


#pragma once 
#define _UCHAR 


#include <stdint.h> 


#define STDC_UTF_16 
#define STDC_UTF_32 


#if I!defined(__cplusplus) 
typedef uint_least16 t char16 tt， 
typedef uint_least32 t char32_t; 
#endif 


各 位 可 以 看 到 ， 我 们 在 代码 清单 5-8 中 用 的 是 uint_least16_t 类 型 来 
定义 char16_t; 使 用 uint_least32_t 类 型 来 定义 char32_t。 这 都 是 在 C11 标 
准 中 所 采用 的 定义 方式 。 关 于 类 型 定义 的 相关 内 容 ， 各 位 可 以 详细 参 
考 13.4 节 内容 。 


如 果 当 前 系统 没有 文 持 <ucharh>， 那 么 我 们 也 束 无 法 使 用 Unicode 
库 函 数 ， 因 此 笔者 这 里 目 己 实现 了 UTF-16 字 符 串 与 UTF-8 字 符 串 编码 
之 间 相 互 转换 的 函数 库 ， 头 文件 为 "zenny_utftransh"， 各 位 可 在 第 20 章 
中 获得 完整 的 源 代 码 。 一 般 ，C 语 言 运行 时 环境 对 宽 字 符 的 输入 /输出 
做 得 都 不 太 成 熟 ， 宽 字符 库 函 数 使 用 起 来 也 比较 麻烦 ， 所 以 通常 我 们 
还 是 以 UTF-8 字 符 串 的 形式 加 以 输出 。 最 后 ， 以 上 代码 各 位 最 好 运行 
在 默认 语言 环境 以 UTF-8 进 行 编码 的 系统 上 。 在 Windows 系 统 上 ， 由 于 


新 建文 件 的 编码 格式 都 是 根据 本 地 语言 环境 设置 的 ， 中 文 环境 下 默认 
为 GBK 编 码 。 所 以 ， 如 果 我 们 想 要 将 当前 源 文件 的 字符 编码 格式 转换 
为 UTF-8， 那 么 可 以 通过 打开 记事 本 ， 然 后 将 当前 文件 另存 为 UTF-8 编 
码 格式 ， 最 后 再 履 盖 原 有 文件 即 可 。 不 过 ， 由 于 Windows 系 统 的 打印 
函数 的 输入 字符 串 也 需要 与 当前 系统 文 持 的 语言 环境 编码 格式 一 致 ， 
所 以 如 果 和 要 打印 输出 字符 串 的 话 ， 需 要 最 终 通 过 系统 API 将 UTF-8 格 式 
编码 转换 为 当前 系统 默认 的 编码 格式 。 我 们 看 代码 清单 5-9 的 内 容 。 


代码 清单 5-9 ”Windows 系 统 下 将 UTF-8 编 码 字 符 串 转 为 系统 默认 
编码 字符 串 


#include <Windows .h> 
#include <stdio.h> 
#include <string.h> 
#include <stdlib.h> 


static void UTF8ToDefaultString(char dst[], const char *pUTF8SrcStr) 
{ 


if (dst == NULL || pUTF8SrcStr == NULL) 
return; 


// 源 UTF -8 字符 串 的 字 节 个 数 
const size t srcLen = Strlen(pPUTF8SrcStr ) ， 
if (srcLen == 0) 

return; 


// 声明 widechars 作 为 中 间 转换 的 宽 字符 串 

wchar_t *wideChars = NULL 

// 获取 宽 字 符 串 的 实际 转换 长 度 “ 

const int wideSstrLen = MultiByteTowideChar(CP_UTF8, 0, pUTF8SrcStr, 
(int)srcLen, NULL, 0); 


A 


// 动态 分 配 wideChars 
wideChars = malloc(wideSstrLen); 


// 做 UTF -8 字符 串 到 宽 字符 串 的 转换 
MultiByteTowideChar(CP_UTF8, 0, pUTF8SrcStr, (int)srcLen, 
widechars， wideStrLen) 


// 获取 系统 默认 编码 的 目的 多 字 节 字符 串 的 长 度 

const int dstLen = WideCharToMultiByte(CP_ACP, 0, wideChars, 

wideSstrLen, NULL, 0, NULL, NULL); 

// 将 中 间 宽 字符 捉 转 换 为 系统 默认 编码 的 目的 多 字 委 字符 溃 

WideCharToMultiByte(CP_ACP, ©0, wideChars, wideStrLen, dst, dstLen, 
NULL, NULL); 


= 


// 在 日 的 子 符 囊 最 后 洪 加 "'\0' 作 为 结束 符 
dst[dstLen] = '\0'，; 


// 释放 widechars 
free(wideChars); 


} 

int main(void) 

{ 、 。 
// 声明 存放 系统 默认 的 多 字 节 字符 数组 
char dstchars[32]; 
const char *utf8Str = u8" 你 好 ,世界 !"， 


// 将 UTF- 8 编码 格式 的 字符 串 转换 为 系统 默认 编码 的 多 字 节 字符 串 
UTF8ToDefaultString(dstChars, utf8Str),; 


// 输出 目的 


A 
J 子 付 串 


puts(dstchars); 


getchar(); 


各 位 在 编译 运行 代码 清单 5-9 之 前 请 务必 确认 当前 的 C 源 文件 的 字 
从 编码 格式 为 UTF-8， 否 则 编译 会 不 通过 。 此 外 ， 上 述 代 码 如 果 使 用 
的 Visual Studio 集 成 开发 环境 ， 那 么 只 能 使 用 MSVC， 因 为 当前 VS- 
Clang 对 UTF-8 编 码 格式 的 源 文件 文 持 不 好 ， 会 引发 编译 错误 。 当 然 ， 
如 果 我 们 在 Windows 系 统 下 直接 使 用 MinGW 或 Clang 编 译 器 也 能 正常 编 


译 通过 。 


另外 ， 笔 者 是 在 macOS 系 统 上 运行 的 上 述 代 码 。 在 macOS 系 统 
下 ， 默 认 的 宽 字 符 编码 格式 正好 为 UTF-16 编 码 ， 所 以 与 charl6_t 类 型 
兼容 。 在 其 他 环境 下 就 未 必 能 正常 显示 上 述 输 出 字符 串 了 ， 请 各 位 读 
者 注意 。 


5.1.8 ”size_t 与 ptrdiff_t 类 型 


size_t 在 之 前 的 标准 中 主要 用 于 sizeof 操 作 符 的 返回 类 型 。C11 标 准 
引入 了 _Alignof 操 作 符 之 后 ， 它 的 返回 类 型 也 是 size_t。size_t 定 义 在 
<stddef.h> 头 文件 中 。 通 常 我 们 使 用 size_t 作 为 一 个 指针 (或 地 址 ) 转 
换 一 个 整数 的 方式 ， 它 一 般 是 无 符号 的 。 在 MSVC 与 MS-Clang 编 译 器 
中 ，32 位 环境 下 被 定义 为 unsigned int，64 位 环境 下 被 定义 为 unsigned 
long long。 在 GCC 和 Clang 编 译 器 中 ， 无 论 是 32 位 还 是 64 位 环境 ， 


size_t 都 被 定义 为 unsigned long， 因 为 unsigned long 在 GCC 和 Clang 中 ， 
在 32 位 环境 下 是 32 位 的 ， 在 64 位 环境 下 是 64 位 的 。 这 么 一 来 ， 无 论 是 
哪个 编译 釉 ，size_t 数 据 类 型 都 能 存放 当前 系统 环境 下 的 一 个 地 址 长 
上 度 。 我 们 将 在 5.5 节 详细 讲解 sizeof 操 作 符 ;6.5.1 和 介绍 _Alignof 操 作 
从 ; 第 7 章 详细 讲解 指针 与 地 址 。 


ptrdiff t 类 型 用 于 两 个 指针 相 减 后 的 结果 类 型 ， 它 是 市 符号 的 ， 在 
<stddef.h> 头 文件 中 定义 。 在 通常 C 语 言 实现 中 ， 写 的 视 度 与 size_t 相 
同 ， 仅 有 的 区 别 是 ptrdiff_t 是 帝 符 号 的 ， 而 size_{t 则 往往 是 无 符号 的 。 
下 面 的 例子 会 涉及 后 续 章 节 的 知识 〈 见 代码 清单 5-10) ， 读 者 可 以 先 
了 解 一 下 ， 等 学 到 相关 知识 后 可 以 回 过 头 来 再 仔细 思考 。 


代码 清单 5-10 size_t 与 ptrdiff_t 


#include <stdio.h> 
#include <stddef.h> 


int main(int argc, const char * argv[]) 


// 用 size_t 声 明了 对 象 a 
size t a = sizeof(a); // a 的 值 为 a 类 型 的 宽度 〈 即 占用 多 少 字 节 ) 


// 定义 了 指 同 size_t 类 昏 的 指针 对 象 p， 并 将 它 指 同 对 象 a 的 地 址 
size _t *p = &a; 


int b = 100 


// 定义 了 指向 int 类 型 的 对 象 9， 并 将 它 指向 对 象 b 的 地 址 
int *q = &b; 


size t si 
size t S2 


// 这 里 ， 对 size_t 类 型 的 格式 符 需 要 加 前 级 z 
printf("Address of a is: Ox%16zX\n", s1); 
printf("Address of b is: Ox%16zX\n", s2); 


// 这 里 ， 对 ptrdiff_t 类 型 的 格式 符 需 要 加 前 级 
ptrdiff_t diff = (ptrdiff_t)q - ob t)p; 
printf("Address of a minus address of b is: %td\n", diff); 


(size_t)p; 
(size_t)q; 


在 代码 清单 5-10 中 ，##ixnclude<stddef.h> 可 省 ， 因 为 它 已 经 包含 在 
<stdio.h> 头 文件 中 了 。 


5.1.9 ”C 语 言 中 的 标准 整数 类 型 


在 前 面 所 讲述 的 整数 类 型 中 ， 我 们 已 经 提起 过 像 int、long 之 类 的 
类 型 在 不 同 的 编译 运行 环境 下 可 能 会 有 不 同 字 节 长 度 ， 尤 其 是 long 类 
型 。 为 了 能 使 代码 适应 更 广泛 的 编译 执行 环境 ， 我 们 在 编写 C 语 言 代 
码 时 可 以 考虑 使 用 从 C99 标 准 台 已 经 引入 的 标准 整数 类 型 。 标 准 整数 
类 型 一 般 被 定义 在 <stdint.h> 头 文件 中 ， 主 要 包含 以 下 几 类 。 


1) 固定 宽度 的 整数 类 型 ， 当 前 标准 能 够 支持 int8_t、uint8_t、 
int16 t、uint16 t、int32 t、uint32 t、int64 t、uint64 t 这 些 常 用 的 类 
型 。 使 用 这 些 类 型 之 后 ， 我 们 就 无 需 纠结 signed char 的 字 世 宽度 、 


short 的 字 节 宽度 、long 的 字 节 宽度 等 都 是 多 少 ， 因 为 这 些 类 型 从 字面 
上 就 已 经 表明 了 它们 分 别 占 多 少 字 节 。 比 如 int8_t 的 宽度 就 是 1 个 字 贡 
(8 比特 ) ; int32_t 则 是 4 个 字 节 (32 比特 ) 。 此 外 ， 以 int 作 为 前 级 的 
类 型 表示 是 带 符号 的 类 型 ， 以 uint 为 前 缀 的 类 型 表示 无 符号 类 型 。 所 
以 ， 我 们 今后 写 C 语 言 代码 时 应 当 优 先 考 虑 这 些 标准 整数 类 型 。 除 了 
这 些 常用 的 标准 整数 类 型 外 ，C11 标 准 还 定义 了 其 他 固定 宽度 的 标准 
类 型 ， 不 过 这 些 类 型 都 是 可 选 的 ，C 语 言 实现 没 必要 一 定 支 持 ， 比 


如 : int24 t、 uint24 t、 int40 t、uint40 t、 int48 t、 uint48 t、 int56 {t、 


Uint56 ft。 


2) 最 小 宽度 整数 类 型 : 这 些 整数 类 型 表示 至 少 需要 满足 所 指定 的 
比特 位 数 ， 但 允许 占用 更 多 的 比特 位 。 这 些 类 型 主要 有 : 


int_least8 _t 、 uint least8 t 、 int least16 t 、 uint least16 t、 


int_least32 t、uint least32 t、int least64 t、uint least64 t。 上 此外， 还 


有 可 选 的 24、40、48、56 比 特 宽 度 的 最 小 宽度 整数 类 型 。 


3) 最 快 最 小 宽度 的 整数 类 型 : 这些 整数 类 型 往往 用 于 快速 计算 。 
它们 与 最 小 宽度 整数 类 型 类 似 ， 至 少 需 要 满足 所 指定 的 比特 位 数 。 不 
过 与 最 小 宽度 整数 类 型 不 同 的 是 ， 它 们 往往 具有 更 快速 的 计算 速度 。 
比如 说 ， 有 些 硬件 〈 比 如 AMD 的 基于 GCN 架 构 的 GPU) 具有 24 位 整数 
的 快速 乘法 计算 ， 那 么 当 程序 员 使 用 了 int_fast24_t 时 ， 则 能 暗示 编译 
器 生成 利用 这 种 快速 乘法 的 指令 。 这 些 类 型 主要 包括 : int_fast8_t、 


uint fast8 _t 、 int fast16 t 、 uint fast16 t 、 int_ fast32 t、 uint fast32 t、 
int_fast64_t、uint_fast64_ t。 另 外 ， 还 有 可 选 的 24、40、48、56 比 特 视 
度 o 


4) 能 存放 对 象 指针 的 整数 类 型 : 该 类 型 有 intptr_{t 与 uintptr_t 两 
个 。 前 者 是 带 符 号 的 ， 后 者 是 无 符号 的 。 这 个 类 型 用 于 将 一 个 对 象 的 
地 址 或 是 一 个 指针 对 象 的 值 用 一 个 整数 存放 起 来 。 


5) 最 大 宽度 的 整数 类 型 .这 种 类 型 表示 当前 C 语 言 实现 能 容纳 所 
有 整数 的 最 大 整数 类 型 ， 有 intmax_t 和 uintmax_t 这 两 个 。 代 码 清 单 5-11 
描述 了 以 上 这 些 标 准 整数 类 型 的 使 用 。 


代码 清单 5-11 标准 整数 类 型 


#include <stdio.h> 


// 由 于 <stdboo1l1.h> 与 <stdint.h> 没 有 被 包含 在 <stdio.h> 头 文件 中 ， 所 以 需要 另外 引入 
#include <stdbool.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 


// 声明 一 个 标准 布尔 类 型 对 象 b 
bool b = true; 


// 声明 一 个 字符 类 型 对 象 c 
char c= 'A 


; 
// 声明 一 个 带 符号 8 位 整数 对 象 s8 


int8_t S8 = 10; 


// 声明 一 个 无 符号 16 位 整数 对 象 u16 
uint16_t u16 = 190; 


// 声明 一 个 带 符号 32 位 整数 对 象 S32 
int32_t S32 = 1000; 


// 声明 一 个 无 符号 64 位 整数 对 象 uU64 
// 这 里 的 整数 字面 量 仍 然 可 以 用 ULL 作 为 后 级 ， 以 确保 精度 不 丢失 
uint64 t u64 = 10000ULL; 


printf("b = %d, c = %c, s8 = %d, U16 = %u，S32 = %d, u64 = %llu\n", 


b, c, s8, ui16, s32, U64); 


// 声明 了 至 少 需 要 8 比特 的 整数 对 象 18 
int_least8 t 18 = 30; 


// 声明 了 至 少 需 要 16 比 特 的 快速 计算 整数 类 型 对 象 f16 
uint_fast16_t f16 = 40; 


printf("18 + f16 = %d\n", 18 + f16); 


// 声明 了 一 个 能 存放 对 象 指 针 的 无 符号 整数 类 型 对 象 p 
uintptr_t p = (uintptr_t)e&b; // p 这 里 存放 了 对 象 b 的 地 址 


// 声明 了 一 个 能 存放 对 象 指针 的 带 符号 整数 类 型 对 象 diff， 
// 对 象 b 的 地 址 与 对 象 c 的 地 址 的 差 对 其 初始 化 。 

// 这 里 也 可 以 使 用 ptrdiff_t 类 型 
intptr_t diff = (intptr_t)&b - (intptr_t)e&c; 


上 


printf("p = Ox%.16zX\ndiff = %td\n", p, diff); 


// 这 里 输出 最 大 整数 类 型 占 多 少 字 
printf("intmax_t size: %zu ce sizeof(intmax_t)); 


5.2 至 总 类 型 


当前 在 C 语 言 中 有 3 种 实数 浮 点 类 型 ， 分 别 为 float、double 与 long 
double。C 语 言 标 准 仅仅 规定 了 float 类 型 的 精度 是 double 类 型 精度 的 子 
集 ; double 类 型 精度 是 long double 精 度 的 子 集 。 在 一 般 C 语 言 实现 中 ， 
将 float 类 型 设 定 为 32 位 单 精度 浮 点 型 ， 并 采用 IEEE754 中 的 规格 化 浮 点 
数 表 示 方 法 ， 将 double 类 型 设 定 为 64 位 双 精 度 浮 点 型 ， 并 采用 IEEE754 
中 的 规格 化 浮 点 数 表示 方法 ，long double 在 x86 架 构 处 理 絮 下 表示 扩展 
双 精 度 浮 点 (80 位 浮 点 数 ， 一 般 占 用 16 个 字 节 ) ， 这 是 Intel 自 己 扩展 
出 来 的 浮 点 数 格 式 。 而 在 ARM 等 其 他 处 理 姻 架构 下 ，long double 可 能 
与 double 类 型 一 样 ， 表 示 双 精度 浮 点 类 型 ， 但 宽度 仍然 可 能 是 16 字 
节 ， 而 不 是 8 字 广 。 在 一 些 GPU、DSP 或 艇 入 式 处 理 磊 中 ， 浮 点 类 型 可 
能 支持 部 分 IEEE754 标 准 ， 其 至 使 用 其 他 表示 法 也 有 可 能 ， 所 以 各 位 
使 用 时 需要 注意 。 但 在 大 部 分 梨 面 环境 以 及 智能 设备 上 都 基本 可 以 满 
足 IEEE754 标 准 。 


在 C 语 言 中 ， 浮 点 数字 面 量 的 表达 方式 非常 丰富 ， 最 基本 的 就 是 
如 0.1、-100.05 等 这 种 正常 的 十 进 制 浮 点 在 数学 上 的 表示 方法 。 在 十 进 
制 浮 点 数 后 面 添 加 {或 F 后 级 ， 表 示 该 字面 量 是 float 类 型 浮 点 数 ， 不 添 
加 任何 后 缀 表示 double 类 型 浮 点 字面 量 ， 添 加 ] 或 二 后 绥 表 示 long double 
类 型 的 浮 点 字面 量 。 另 外 ， 如 果 浮 点 数 的 小 数 部 分 为 0， 那 么 我 们 也 可 


以 写 为 : 10.、-5. 等 形式 ，10. 相 当 于 10.0。 同 样 ， 如 果 整 数 部 分 为 0， 
那么 我 们 也 可 以 写作 为 .25、.1001 等 形式 ，.25 相 当 于 0.25。 


此 外 ，C 语 言 还 引入 了 对 浮 点 数 的 科学 计数 法 的 表示 。 比 如 ，3e5 
或 3E5 表 示 3*103;，6e-3 或 6E-3 表 示 6*103。 这 里 需要 注意 的 是 ，e 或 E 和 
它 前 后 两 个 数 之 间 都 不 能 有 空白 字符 ， 像 3e 5 就 不 是 3*103 的 科学 计数 
法 表示 了 。 此 外 ，e 或 E 右 边 的 数 必须 是 整数 ， 不 能 是 浮 点 数 。 


C 语 言 还 引入 了 十 六 进 制 浮 点 表示 法 ， 即 一 个 十 六 进 制 数 跟 p 或 
P， 再 跟 一 个 十 进 制 数 ， 表 示 p 或 P 之 前 的 十 六 进 制 数 乘 以 2P 之 后 的 数 。 比 
如 0x3P“ 相 当 于 0x3*22; 0x3.5P-3 相 当 于 0x3.5*2 了 。 这 里 需要 注意 的 
是 ，p 或 P 的 左边 必须 是 一 个 十 六 进 制 整数 或 浮 点 数 ，p 或 P 的 右边 必须 
是 一 个 十 进 制 整数 ， 并 且 十 六 进 制 浮 点 数 表 示 中 ，p 与 指数 部 分 不 可 缺 
省 。 十 六 进 制 浮 点 数 到 十 进 制 浮 点数 的 转换 可 以 参考 第 2 章 的 2.4 市 内 
。 这 里 十 六 进 制 浮 点 数 并 非 采用 IEEE754 所 描述 的 规格 化 浮 点 数 表 
示 法 ， 而 是 一 般 的 二 进 制 浮 点 表示 法 ， 比 如 0x3.5p0 相 当 于 二 进 制 数 的 
整数 部 分 为 0011， 小 数 部 分 为 0101 (一 个 十 六 进 制 数 的 位 数 占 4 个 比 
特 ) 。 其 小 数 部 分 的 计算 直接 用 2-2+2-4=0.3125 即 可 ， 或 者 更 简单 地 ， 
直接 用 5 除 以 16 即 可 得 到 小 数 部 分 结果 ， 所 以 0x3.5 就 相当 于 十 进 制 浮 
点 数 3.3125。 跟 十 六 进 制 整数 计算 方式 类 似 ， 对 于 像 0x1.2345p0 这 种 十 
六 进 制 浮 点 数 的 小 数 部 分 〈 一 般 术 语 上 又 称 为 尾数 部 分 ) 的 计算 方式 
为 : 2/16+3/162+4/163+5/164 。 


喘 


下 面 我 们 将 举 一 些 例子 给 大 家 操练 一 下 ， 见 代码 清单 5-12 。 
代码 清单 5-12 浮 点 类 型 


#include <stdio.h> 
#include <float.h> 


int main(int argc, const char * argv[]) 


{ oy 
// 定义 一 个 单 精度 浮 点 数 对 象 f | 
float f = -3.5E+3f; // f 的 值 为 3.5 * 1000 = -3500.0。 这 里 的 + 表示 正 号 ， 可 省 
printf("f = %f\n", f); 


f = ,25f; // f 的 值 为 0 .25 
printf("f = %f\n", f); 


f = -Ox5p+10f; // f 的 值 为 -5 * 1024 = -5120 
printf("f = %f\n", f); 


// 定义 了 一 个 双 精 度 浮 点 对 象 d 
double d = -100.; // d 的 值 为 -100.0 
printf("d = %f\n", d); 


d = -1200e-5; // d 的 值 为 -1200 * 0.00001 = -0.012 
printf("d = %f\n", d); 


d = Ox30.8p-2; // d 的 值 为 0x30.8 * 0.25 = 48.5 * 0.25 = 12.125 
printf("d = %f\n", d); 


// 定义 一 个 long double 类 型 的 对 象 g 
long double g = -6x3.5POL; // g 的 值 为 -0x3.5 * 1 = -3.3125 
printf("g = %Lf\n", 9g); 


g = Ox18.F8P2L * 2E3L; // (24+0.96875)*4 * 2*1000 = 199750.0 
printf("g = %Lf\n", 9g); 


printf("long double size is: %zu bytes\n", sizeof(g)); 
// 以 下 都 是 用 浮 点 数 的 科学 计数 法 来 打印 出 各 种 类 型 浮 点 数 的 最 大 、 最 小 值 


printf("float min value is: %g\n", FLT_MIN); 
printf("float max Value is: %g\n", FLT_MAX); 


printf("double min value is: %g\n", DBL_MIN); 
printf("double max Value is: %g\n", DBL_MAX); 


printf("long double min value is: %Lg\n", LDBL_MIN); 
printf("long double max value is: %Lg\n", LDBL_ MAX); 


5.3 ”数据 精度 与 类 型 转换 


几乎 所 有 计算 机 编程 语言 都 会 涉及 数据 精度 以 及 类 型 转换 的 问 
题 。 一 般 来 说 ， 一 个 类 型 所 占用 的 字 节 个 数 越 多 〈 即 宽度 越 大 ) ， 其 
精度 也 就 越 蜗 。 在 C 语 言 中 ， 将 整数 精度 等 级 称 为 “整数 转换 等 级 ”。 


C11 标 准 提出 以 下 约定 。 


1) 任意 两 个 不 同类 型 的 带 符 号 整数 不 会 具有 相同 等 级 ， 即 使 它们 
所 表示 的 值 一 模 一 样 。 比 如 在 32 位 环境 中 ， 一 般 int 类 型 与 long 类 型 在 
整数 数值 上 表现 是 完全 一 样 的 ， 痢 表示 32 位 市 符号 整数 ， 但 long 的 等 
级 仍然 高 于 int 的 等 级 。 


2) 更 高 精度 的 带 符 号 整数 类 型 的 转换 等 级 应 该 高 于 较 低 精度 的 带 


符号 整数 类 型 的 等 级 。 


3) 一 个 无 符号 整数 类 型 的 转换 等 级 与 其 相应 的 带 符号 整数 类 型 的 
等 级 相同 。 比 如 ，short 类 型 的 转换 等 级 与 unsigned short 类 型 的 一 样 。 


4) 具体 的 带 符 号 整数 的 转换 等 级 如 下 (从 高 到 低 ) : long long 


int>long int>int>short int>signed char ° 


5) char 的 等 级 应 该 与 signed char 和 unsigned char 相 同 。 


6) size_t 与 ptrdiff_t 的 等 级 不 应 该 高 于 signed long int， 除 非 C 语 言 
实现 需要 文 持 更 大 的 对 象 。 


就 这 一 点 而 言 ，GCC 与 Clang 编 译 器 在 64 位 执行 模式 下 将 size_t 的 
实现 定义 为 unsigned long， 这 是 合乎 标准 的 ， 而 MSVC 与 VS-Clang 却 将 
size_t 定 义 为 了 unsigned long long， 这 显然 没有 遵守 标准 的 一 般 规 定 。 


7) _Bool 类 型 〈 即 布尔 类 型 ) 的 等 级 在 所 有 标准 整数 类 型 中 是 最 
低 的 。 


5.3.1 ”整数 晋升 


对 于 一 个 整数 类 型 ， 如 末 它 的 精度 等 级 在 计算 过 程 中 从 低 转 换 到 
高 ， 那 么 这 个 过 程 称 为 “整数 首 逢 *， 它 是 一 个 隐 式 转换 ， 无 需 程 序 员 
写 投射 操作 符 进行 类 型 转换 。 在 C 语 言 标准 中 ， 之 所 以 称 为 整数 晋升 
是 因为 低 转 换 等 级 提升 到 高 转换 等 级 类 型 ， 在 整数 数据 上 不 会 有 任何 
变化 ， 而 仅仅 是 类 型 变 为 更 高 等 级 了 。 比 如 ， 代 码 清单 5-13 所 示 的 整 
数 类 型 转换 部 属于 整数 普 升 。 


代码 清单 5-13 ”整数 晋升 


#include <stdio.h> 


int main(int argc, const char * argv[]) 


// 声明 了 一 个 signed char 类 型 的 对 象 c 


signed char c = -128,; 


// 声明 了 一 个 short 类 型 对 象 S 


有 Short s = c; // 这 里 对 象 c 做 整数 晋升 到 short 类 型 ， 并 将 值 赋 给 对 
S 

// 声明 了 一 个 int 类 型 对 象 i 

int i = s; // 这 里 对 象 s 做 整数 晋升 到 int 类 型 ， 并 将 值 赋 给 对 象 i 

// 声明 了 一 个 对 象 ]， 并 将 对 象 i 做 整数 晋升 到 1ong 类 型 ， 并 将 值 赋 给 1 

long 1 = i; 


// 声明 了 一 个 对 象 g， 并 将 对 象 1 做 整数 晋升 到 long long 类 型 ， 并 将 值 赋 给 g 
long long g = 1; 


printf("g = %lld\n", g); // 输出 -128 


// 声明 了 一 个 unsigned char 类 型 对 象 a 
unsigned char a = 255,; 


// 声明 了 一 个 unsigned int 类 型 对 象 u 
unsigned int u = a; // 


这 里 将 对 象 a 做 整数 晋升 到 unsigned int， 并 将 值 赋 给 u 


printf("u = %u\n", u); // 输出 255 


5.3.2 ”市 符号 与 无 符号 整 效 之 间 的 转换 


当 一 个 带 符 号 (无 符号 ) 整数 类 型 要 转换 为 男 一 个 无 符号 〈 带 符 
号 ) 整数 类 型 时 ， 如 有 果 转 换 目标 类 型 有 足够 大 的 精度 来 容纳 原始 类 
型 ， 那 么 转换 后 的 值 是 保持 不 变 的 。 


当 一 个 原始 整数 类 型 要 转换 为 无 符号 整数 类 型 时 ， 如 有 果 目 标 无 符 
号 整数 类 型 无 法 容纳 原始 整数 ， 那 么 ， 原 始 整数 值 通过 不 断 地 加 (或 
减 ) 目标 类 型 最 大 能 表示 的 值 再 加 1， 直 到 该 值 恰好 能 落 在 目标 无 符号 
整数 可 表示 范围 内 。 比 如 ， 一 个 -129 的 short 类 型 要 转换 为 unsigned char 
类 型 ， 那 么 将 -129 加 上 unsigned char 最 大 能 表示 的 值 255 再 加 1， 
即 -129+ (255+1) =127。127 正 好 在 unsigned char 所 表示 的 范围 内 ， 加 


法 停止 ，127 就 是 最 终 转换 到 unsigned char 类 型 的 值 。 当 然 ， 这 个 是 正 
式 的 数学 上 的 表达 方式 。 在 实际 应 用 中 ， 我 们 无 需 那么 麻烦 去 计算 ， 

直接 将 超出 目标 无 符号 类 型 的 位 全 都 舍 去 即 可 。 比 如 ，-129 的 16 位 二 

进 制 数 为 1111111101111111， 如 有 果 将 它 转换 为 8 位 无 符号 类 型 ， 那 么 我 
们 直接 将 高 8 位 舍 去 ， 取 其 低 8 位 作为 目标 无 符号 8 位 整数 类 型 即 可 ， 所 
以 转换 后 的 结果 就 是 01111111， 即 0x7F， 对 应 于 十 进 制 数 127。 这 是 高 
精度 原始 整数 转 为 低 精度 无 符号 整数 的 情况 。 如 果 是 一 个 低 精 度 的 带 
符号 整 型 转换 为 更 高 精度 的 无 符号 整数 类 型 ， 那 么 需要 先 判 断 原始 低 
精度 整数 的 符号 位 ， 如 果 是 0 (表示 非 负 整数 ) ， 则 用 0 填充 到 高 精度 
无 符号 整数 ， 如 果 是 1 (表示 负 整 数 ) ， 那 么 用 1 填充 到 高 精度 无 符号 
整数 。 比 如 ， 带 符号 8 位 整数 -1 (二 进 制 数 为 11111111) 将 它 转 为 无 符 


号 16 位 上 整数， 结果 为 1111111111111111， 即 65535。 


当 一 个 原始 类 型 要 转 为 带 符号 整数 类 型 时 ， 如 果 目 标 带 符号 整数 
类 型 无 法 容纳 原始 整数 ， 那 么 结果 是 由 实现 定义 的 ，C 语 言 实现 也 可 
选择 发 出 异常 信号 。 而 现在 主流 C 语 言 编译 器 (比如 MSVC、GCC 和 
Clang) 对 目标 类 型 为 带 符号 整数 类 型 的 转换 与 目标 为 无 符号 整数 类 型 
类 似 。 如 果 是 高 精度 整 型 转 低 精度 带 符号 整 型 ， 那 么 直接 做 二 进 制 数 
的 高 位 截断 即 可 。 如 果 是 低 精 度 的 无 符号 整 型 转 高 精度 带 符号 整 型 ， 
那么 高 位 直接 用 0 扩充 。 比 如 ， 无 符号 8 位 整数 255 转 为 带 符号 16 位 整 
数 ， 仍 然 是 255; 无 符号 16 位 整数 1023 转 为 带 符 号 8 位 整数 ， 即 


0000001111111111 转 为 带 符号 8 位 整数 ， 直 接 截 断 高 8 位 ， 保 留 低 8 位 ， 
得 到 11111111， 结 果 为 -1 。 


综 上 所 述 ， 对 于 当前 主流 C 语 


时 编译 占 而 言 ， 整 数 类 型 转换 主要 


看 源 操 作 数 类 型 ， 如 采 源 操作 数 是 无 符号 整数 类 型 ， 那 么 做 低 精 度 到 


高 精度 的 整数 类 型 转换 时 采用 高 位 填 0 的 方式 ， 如 果 源 操作 数 


市 
家 举 一 些 例子 来 更 好 地 帮助 大 家 理解 带 名 


如 代码 清单 5-14 所 示 。 


A 


代码 清单 5-14 ”市 符号 与 无 符号 数 之 间 的 类 型 转换 


#include <stdio.h> 


int main(int argc, const char * argv[]) 


Short s = -129; 


unsigned char uc = s,; 


printf("uc = %u\n", uc); 


unsigned short us = 1023; 


uc = us; 


// 


接 截 取 us 高 8 位 赋值 给 uc 


printf("uc = %u\n", uc); 


uc = 128; 


s = Uc; // uc 为 无 符号 整数 ， 
printf("s = %d\n", s); 


signed char sc = -1 
s = sc; // sc 是 带 符 号 整数 ， 将 符号 位 (这 


CH 


了 


0D 
LI 


uc = 127 


所 已 


printf("s = %d\n", s); 


sc = Us; 


printf("sc = %d\n", sc); 


这 里 是 将 s + 256 = 127 赋 值 给 uc 
AAA 


度 


// 输出 : uc = 0 
接 扩充 0 到 short 宽 度 
// 输出 : s = 128 
里 是 1) 扩展 到 short 类 型 宽 
// 输出 : s = -1 
// 直接 截断 us 高 8 位 ， 取 其 
// 输出 : sc = -1 


低 8 位 给 sc 


上 


征 市 符号 
整数 类 型 ， 那 么 做 低 精 度 到 高 精度 的 整数 类 型 转换 时 采用 的 是 高 位 
符号 位 的 方式 。 而 对 于 高 精度 到 低 精 度 的 整数 转换 ， 无 论 源 操 作 数 
符号 整数 还 十 无 符号 整数 ， 部 十 采用 高 位 截断 的 方式 。 下 面 将 给 


填 


EI 
全 


号 与 无 符号 数 之 间 的 转换 ， 


us = uc; // uc 是 无 符号 整数 ， 直 接 志 到 unsigned short 类 型 的 宽度 


printf("us = %u\n", us); / 输出 : us = 128 

// SC 是 带 符号 整数 ， 将 符号 位 (这 里 是 1) 扩展 到 unsigned short 类 型 宽度 

us = sc; 

printf("us = Ox%.4X\n", us); // 输出 : us = Qxffff 

S = 

We // 直接 截断 s i 取 其 低 8 位 
pnt Ci = %d\n", uc); // 输出 : d = 


一 一 一 


在 有 些 较 老 版 本 的 编译 器 或 者 把 编译 侣 警 告 等 级 调 得 较 高 的 情况 
下 ， 高 转换 等 级 的 整数 类 型 转换 为 低 转换 等 级 的 整数 可 能 会 出 现 警 
告 ， 此 时 我 们 可 以 用 投 别 操 作 符 (cast operator) 做 显 式 的 类 型 转换 来 


规避 这 些 汐 告 。 不 过 ，C11 标 准 提 到 的 是 ， 投 射 操 作 符 主要 用 于 涉及 
指针 的 类 型 转换 ， 对 于 基本 数据 类 型 ， 可 用 也 可 不 用 。 


投 射 操作 符 非 常 简 单 ， 束 是 用 圆 括号 将 某 个 类 型 包 半 住 。 比 如 : 


(int) 、 (long long) 等 。 


代码 清单 5-15 描 述 了 投 丑 操 作 符 的 使 用 方法 。 


代码 请 单 5-15 ”投射 操作 符 的 使 用 


#include <stdio.h> 
int main(int argc, const char * argv[]) 


signed char c = 100; 


// signed char 的 转换 等 级 比 jnt 要 低 ， 所 以 在 任何 情况 下 都 无 需 投射 操作 符 
// 但 是 加 上 投射 操作 符 做 显 式 类 型 转换 也 没 问 题 


int i = c; 


// short 的 转换 等 级 比 int 低 ， i 下 不 用 投射 操作 符 可 能 会 有 警告 
short s = (short)i; / 将 变量 i 通过 投射 操作 符 强 制 转 为 short 类 型 


s = (short)65536L + (short)65536LL; 


printf("s = %d\n", s); // 输出 0 


投 丑 操作 符 的 优先 级 仅 次 于 单 目 操 作 符 ， 比 乘法 操作 符 优 先 级 
高 。 关 于 投 冉 操作 符 的 详细 介绍 请 见 5.6 市 内容 。 


5.3.3 ”学 扩 数 与 浮 扣 数 的 园 换 以 及 浮 操 数 与 整数 
之 间 的 转换 


浮 扣 数 之 则 的 转换 与 整数 之 则 的 转换 不 同 。 因 为 一 般 处 理 占 架构 
采用 的 是 IEEE754 规 格 化 浮 点 表示 法 ， 所 以 大 多 数 十 进 制 浮 点 数 无 法 
精确 地 用 二 进 制 浮 点 数 来 表示 ， 这 是 由 于 其 尾数 部 分 实际 上 都 是 通过 
2 进行 相 加 拟 合 而 成 的 。 所 以 ， 我 们 在 比较 两 个 浮 点 数 的 时 候 必 须 谨 
慎 使 用 == 相 等 性 操作 符 。 


如 果 一 个 处 理 器 架构 支持 IEEE754 标 准 ， 那 么 单 精度 浮 点 与 双 精 
度 浮 点 的 转换 直接 可 根据 IEEE754 标 准 中 浮 点 数 的 表示 方式 进行 。 对 
于 单 精 度 浮 点 数 转 双 精度 浮 点 数 ， 双 精度 浮 点 数 的 符号 位 以 及 尾数 高 
位 有 效 数 都 不 需要 变动 ， 仅 仅 是 尾数 低位 添 0， 而 阶 码 部 分 则 是 用 原始 
单 精度 浮 点 的 指数 加 上 双 精 度 浮 点 数 指定 的 中 经 指数 偏差 即 可 。 而 双 
精度 转 单 精度 则 可 能 会 产生 精度 丢失 。 


C11 标 准 提 到 ， 一 个 有 限 浮 点 型 实数 〈 即 它 不 是 一 个 非 数 NaN， 也 

不 是 一 个 无 穷 大 数 INF) 可 以 转换 为 除 布尔 类 型 之 外 的 其 他 所 有 整数 
类 型 ， 然 后 其 小 数 部 分 被 丢 痉 ， 也 就 是 说 它 的 值 癌 零 截断 。 如 有 果 一 个 

浮 点 数 转 为 较 低 精度 的 无 符号 整数 (比如 一 个 单 精度 浮 点 数 转 为 一 个 
无 符号 8 位 整数 ) ， 那 么 该 浮 点 数 是 先 转 为 与 它 相 同 宽度 的 带 符 号 整数 
( 先 转 signed int) ， 然 后 再 转 为 相应 更 低 精 度 的 无 符号 整数 (再 转 
unsigned char) ， 还 是 直接 转 为 与 低 精度 无 符号 整数 相同 宽度 的 帝 符 
号 整数 〈 先 转 signed char) ， 然 后 再 转 为 该 相同 精度 的 无 符号 整数 
(再 转 unsigned char) ， 这 一 点 在 标准 中 没有 提 到 ， 也 是 由 实现 定义 
的 。 同 样 ， 当 一 个 整数 转 为 一 个 浮 点 数 时 ， 倘 寿 目 标 浮 点 数 无 法 容纳 
原始 整数 的 数值 范围 ， 那 么 结果 也 是 未 定义 的 。 


下 面 我 们 将 举 一 些 例子 来 描述 浮 点 数 与 浮 点 数 之 间 的 转换 ， 以 及 
浮 扣 数 与 整数 之 则 的 相互 转换 ， 如 代码 清单 5-16 所 示 。 


代码 清单 5-16 浮 点 数 与 整数 之 间 的 转换 


#include <stdio.h> 

int main(int argc, const char * argv[]) 
float f = 3.1415926f; 
double d = ff; 


// 输出 1， 说 明 两 者 相等 
printf("d == 3.1415926f? %d\n", d == 3.1415926f); 
两 


// 输出 9， 说 明 两 者 不 相等 。 i 

// 因为 3.1415926 这 个 字面 量 在 单 精度 与 双 精 度 浮 点 的 表达 上 不 具有 相同 尾数 ， 

// 由 于 双 精 度 具 有 更 高 精度 ， 所 以 其 尾数 部 分 不 是 简单 地 通过 在 单 精度 浮 点 的 基础 上 添加 零 所 得 ， 
// 而 是 继续 对 该 小 数 做 进一步 拟 合 ， 由 得 双 精 度 序 点 数 与 所 表 过 的 字面 量 的 值 更 接近 。 

// 所 以 ， 这 里 同样 都 是 3.1415926， 但 多 个 f 和 少 个 f 就 有 千差万别 了 

printf("d == 3.1415926? %d\n", d == 3.1415926); 


d = 3.1415926; 

f = d; 

// 输出 1， 说 明 两 者 相等 。 

// 由 于 3.1415926 在 单 精度 浮 点 数 的 精度 范围 内 ， 所 以 精度 在 转换 过 程 中 没有 损失 


printf("f = 3.1415926f? %d\n", f == 3.1415926f); 


int i = ff; 
printf("i = %d\n"， 主 );// 输出 3， 说 明 仅 保留 浮 点 数 的 整数 部 分 ， 而 把 小 数 部 分 全 都 截断 


i = 100.5 + 200.5; 


// 输出 391， 说 明 这 里 两 个 浮 点 数 相 加 ， 是 将 结果 先 以 双 精 度 浮 点 的 形式 保存 ， 
// 最 后 再 转换 为 nt 类 型 
printf("i = %d\n", i); 


i = (int)100.5 + (int)200.5; 


// 输出 309， 由 于 这 里 是 先 分 别 将 100.5 和 200 .5 转 为 int 类 型 整数 。 
// 所 以 ， 在 它们 相 加 之 前 ， 小 数 部 分 已 经 都 被 截断 ， 使 得 结果 为 100 + 200 
printf("i = %d\n", i); 


d = -100000000000.99999999999， 
unsigned char uc = d; 
printf("uc = %u\n", uc); // 输出 0 


uc = (long long)d; 
printf("uc = %u\n", uc); // 输出 255 


uc = (int)d; 
printf("uc = %u\n", uc); // 输出 0 


代码 清单 5-16 的 示例 是 采用 Apple LLVM 8.0 编 译 器 ， 基 于 Intel 
Haswell 架 构 处 理 器 ， 在 macOS 10.12.3 系 统 上 运行 后 得 出 的 。 


5.4 C 语 言 基 本 运算 操作 和 从 


对 于 我 们 上 面 提 到 的 整数 类 型 对 象 ， 可 以 使 用 加 减 乘 除 、 求 模 等 
算术 运算 操作 符 ， 还 有 正 负 号 单 目 操作 符 ， 目 增 、 目 减 操 作 符 ， 按 位 
与 、 按 位 或 、 按 位 异 或 、 按 位 取 反 这 四 种 按 位 逻辑 运算 操作 符 ， 以 及 
移 位 操作 符 。 对 于 浮 点 类 型 对 象 ， 可 以 使 用 加 减 乘 除 算术 运算 操作 
符 ， 还 有 正 负 瑟 单 目 操 作 符 ， 目 增 、 目 诚 操作 符 。 这 些 操作 符 的 计算 
优先 级 可 参考 4.2.4 节 中 的 内 容 。 


5.4.1 加 、 减 、 乘 、 除 与 求 模 运 算 操 作 符 


计算 两 个 整数 和 浮 点 数 的 和 、 差 、 积 、 商 、 余 数 〈 仅 整数 可 用 ) 
可 以 分 别 通 过 加 、 减 、 乘 、 除 、 求 模 这 些 操作 来 实现 。 这 些 操作 对 应 
的 操作 符 在 C 语 言 中 分 别 记 为 +、-、*、/、%。 这 些 都 属于 双 目 操作 
符 ， 即 每 种 操作 都 需要 两 个 操作 数 (operand) 。 在 C 语 言 中 还 有 对 左 
边 操作 数 与 右边 操作 数 进行 计算 ， 然 后 直接 把 计算 结果 赋 给 左 操 作 数 
的 简易 操作 符 ， 与 上 述 操 作 符 分 别 对 应 为 : +=、-=、*=、/=、%=。 在 
C 语 言 标准 中 称 之 为 复合 赋值 操作 符 compound assignment 
operator) 。 这 里 各 位 要 注意 的 是 ， 在 做 除法 和 求 模 计算 的 时 候 ， 除 数 


( 即 右 操作 数 ) 不 能 为 零 ， 否 则 整个 应 用 可 能 会 导致 异常 。 下 面 我 们 
举 一 些 简单 的 例子 来 看 看 这 些 操 作 符 的 使 用 ， 如 代码 清单 5-17 所 示 。 


代码 请 单 5-17 ”基本 算术 运算 操作 符 


#include <stdio.h> 


int main(int argc, const char * argv[]) 


int a = +100; // 这 里 的 + 可 省 


int b = -a; // b = -100 

int c =a+b; // a + b 的 值 为 9， 所 以 c 的 值 为 9 

a *= b; // 相当 于 a = a * b，a 的 值 为 -10000 
c /= a; // 相当 于 c = c / a，c 的 值 为 9 

b %= 3; // 相当 于 b = b % 3，-100 除 以 3 的 余数 为 -1 
printf("a + Cc = %d\n", a+ b+c); // 输出 -10001 

b+=1+2+ 3; / 这 里 相当 于 : b = b + (1 + 2 + 3) 
float x = 10.25f,; 

float y = -0.25f; 

x += y; // 相当 于 x = x + y，x 的 值 为 19 ,0f 

y -= Xx; // 相当 于 y = y - x，y 的 值 为 -9.25f - 10.0f = -10.25f 

printf("y / x = %f\n", y / x); // 输出 -1.025000 


5.4.2” 按 位 逻辑 操作 符 


按 位 逻辑 操作 符 可 对 任何 整数 类 型 进行 操作 ， 包 括 布尔 类 型 ,但 
不 包括 浮 点 数 类 型 。 按 位 与 、 按 位 或 、 按 位 异 或 以 及 按 位 取 反 ， 在 C 
语言 中 的 操作 符 分 别 对 应 为 ， &、|、^、~。 同 样 ， 按 位 与 、 按 位 或 和 
按 位 异 或 ， 都 有 直接 赋值 的 操作 表达 方式 ， 分 别 为 : &=、|=、^=。 


下 面 举 儿 个 例子 来 介绍 按 位 逻辑 操作 符 的 基本 用 法 ， 并 且 给 出 一 
些 需 要 注意 的 细 市 ， 如 代码 清单 5-18 所 示 。 


代码 请 单 5-18 ”基本 按 位 逻辑 操作 符 


#include <stdio.h> 
int main(int argc, const char * argv[]) 
全 b = false; 


b |= true; // 相当 于 p = b | 1 
printf("b = %d\n", b); // 输 


// 各 位 注意 ，~b 的 结果 仍然 是 1 1 
// 之 前 已 经 提 到 ， 在 C 语 言 中 任何 具有 返回 类 型 的 表达 式 都 可 充当 一 个 布尔 表达 式 ， 
// 然后 对 于 上- 面 的 布尔 变 和 量 b， 其 内 部 二 进 制 表示 是 00000001 (在 Clang 中 它 占用 1 个 字 节 ) 。 
// 所 以 ， 这 里 对 b 采 用 按 位 取 反 操 作 后 ， 内 部 结果 应 该 变 为 11111119， 十 六 进 制 数 为 bxfe 。 

// Te 0xfe 与 0 比较 ， 当 然 不 相等 ， 所 以 结果 为 true 
b = // 由 于 按 位 取 反 只 需要 一 个 操作 数 ， 所 以 它 没有 ~= 这 种 形式 
ne = %d\n", b); // 输出 1 


unsigned long long x = OxffffffffffffffffULL; 


// 0 原本 是 int 类 型 ， 但 &= 的 左 操作 数 是 一 个 unsigned long long 类 型 ， 
// 转换 等 级 比 int 要 高 ， 所 以 这 里 的 6 会 先 被 隐 式 做 整数 晋升 ， 
// 把 它 提升 到 unsigned long long 的 宽度 ， 然 后 再 对 它 做 按 位 取 反 操作 

x &= ~0; // 这 里 相当 于 x = x & ~0。 操 作 后 ，x 的 值 仍然 为 0xffffffffffffffff 


int a = 0; 
x &= ~a; // 这 里 与 上 述 情况 一 样 
printf("x = 0x%.1611XNn"，X); // 输出 Oxffffffffffffffff 


5.4.3 ”日 增 、 日 减 操 作 符 


目 增 、 目 减 操 作 符 可 用 于 整数 类 型 与 浮 点 数 类 型 的 变量 ， 也 能 用 
于 指针 变量 。 不 过 它们 只 能 作用 于 可 被 修改 的 左 值 (关于 左 值 的 概念 
青 参 考 14.4 生 ) 。 自 增 、 自 减 操 作 符 有 两 种 形式 ， 一 种 是 作为 前 绥 操 
作 符 ， 另 一 种 是 作为 后 纵 操 作 符 。 作 为 前 绥 操 作 符 时 ， 其 计算 优 移 级 
作为 单 目 操作 符 的 优先 级 ， 所 以 其 作为 后 级 操作 符 的 计算 优先 级 比 作 
为 前 缀 操作 符 的 优先 级 要 融 一 级 。 当 目 增 作为 前 级 操作 符 使 用 时 ， 
的 计算 过 程 就 相当 于 (操作 数 +=1) 。 前 级 ++ 操 作 符 的 结果 束 是 操作 


数 执行 递增 之 后 的 值 。 比 如 : intb=++a; 就 好 比 int b; a+=1; b=a; ， 
或 int b=a+1; a+=1; 前 级 自 减 操作 符 也 同样 如 此 。 当 自 增 作为 后 级 操 
作 符 使 用 时 ， 后 级 ++ 操 作 符 的 结果 是 操作 数 执行 ++ 之 前 的 值 。 然 后 ， 
操作 数 对 象 的 值 将 作为 副作用 在 原 有 基础 上 递增 。 对 后 级 ++ 操 作 结 果 
的 值 计 算 ， 其 顺序 将 在 更 新 操作 数 本 号 值 的 副作用 之 前 。 比 如 : int 

b=a++; 就 好 比 int b=a; a+=1; 后 级 -- 操 作 符 也 同样 如 此 。 


下 面 举 一 些 简单 易 慌 的 例子 ， 如 代码 清单 5-19 所 示 。 


代码 清单 5-19 ” 自 增 自 减 操 作 符 


#include <stdio.h> 
int main(int argc, const char * argv[]) 
int a = 1; 


int b = ++a; / 相当 于 int b = a += ee 来 的 值 加 1 的 结果 
int c = a++ + ++b; // < 的 值 为 十 和 + 1)， 然 后 a 写 各 自 刀 


// 输出 : a b=3, 5 
printf("a = = b = gq, c= %d\n", a, b, c); 


float f = 10.5f; 
float g = f++; // 9 的 值 为 原来 f 的 值 ， 然 后 f 递 增 


// 输出 : f = 11.500000，g = 10.500000 
printf("f = %f, g = %f\n", f, g); 


在 使 用 递增 、 递 减 的 时 候 往 往 会 率 涉 程序 执行 顺序 问题 ， 关 于 此 
问题 读者 可 参考 14.5 节 。 


5.4.4 ”关系 操作 答 、 相 等 性 操作 符 与 逻辑 操作 和 从 


在 C 语 言 中 ， 关 系 操作 符 (relational operators) 的 表示 基本 与 数学 
上 的 表示 一 致 一 一 用 > 表示 大 于 关系 ， 用 < 表示 小 于 关系 ， 用 >= 表 示 大 
于 等 于 关系 ， 用 <= 表 示 小 于 等 于 关系 。 相 等 性 操作 符 (equality 
operators) 就 两 个 : 一 个 是 == 表 示 相 等 ， 另 一 个 是 ! = 表示 不 等 。 用 这 
些 操作 符 计算 得 到 的 结果 是 一 个 int 类 型 。 如 果 这 些 操作 符 的 左 操 作 数 
满足 右 操作 数 的 指定 关系 ， 那 么 返回 1， 人 否则 返回 0。 在 5.1.5 节 中 已 经 
所 到 了 ， 由 于 C 语 言 一 开始 并 没有 引入 “布尔 类 型 "这 个 概念 ， 而 仅仅 
征 通 过 与 0 比较 来 得 出 真 假 值 。 所 以 吏 当 前 的 C11 标 准 而 言 ， 这 些 操作 
符 所 返回 的 类 型 仍然 被 定义 为 int 类 型 ， 而 不 是 _Bool 类 型 ， 这 是 为 了 能 
与 之 前 C90 标 准 的 C 代 码 进 行 兼容 。 但 是 对 现代 化 C 语 言 编程 而 言 ， 我 
们 应 该 勤 用 布尔 类 型 ， 这 不 仅 有 助 于 对 编程 语言 相关 概念 的 理解 ， 而 
且 在 代码 上 也 更 具 可 读 性 与 逻辑 性 ! 同时 ， 当 我 们 要 转 到 Java、Swift 
等 比 C 语 言 类 型 更 强 的 编程 语言 上 时 也 能 更 顺手 些 。 所 以 ， 笔 者 这 里 
强烈 推荐 各 位 将 关系 操作 符 以 及 相等 性 操作 符 的 结果 类 型 视 为 bool 类 
型 \ 需 要 引入 <stdbool.h> 标 准 库 头 文件 ) ， 然 后 将 满足 指定 关系 的 值 
看 作为 “ 真 ”(true) ， 将 不 满足 关系 的 值 看 作为 “ 假 ” (false) 。 


由 于 关系 操作 符 与 相等 性 操作 符 比 较 人 简单 ， 而 且 与 我 们 日 常用 的 
数学 上 的 操作 很 接近 ， 所 以 不 过 多 介绍 。 本 市 主要 为 大 家 介绍 一 下 远 
辑 操 作 符 。C 语 言 中 有 3 种 逻辑 操作 符 ， 远 辑 与 && 表 示 并 且 ;， 人 逻辑 或 | 
表示 或 者 ;逻辑 非 ! 表示 否 。C 语 言 标 准 规定 ， 逻 辑 操 作 符 的 操作 数 
都 应 该 是 int 类 型 的 表达 式 ， 计 算 结 采 也 是 int 类 型 。 但 这 里 也 推荐 各 位 


将 逻辑 操作 符 的 操作 数 以 及 计算 结果 视 为 布尔 类 型 。 下 面 我 们 分 别 介 


绍 这 3 种 逻辑 操作 符 。 


@ 逻 辑 与 是 一 个 双 目 操作 符 ， 其 计算 过 程 是 先 判 定 左 操作 数 的 值 
征 否 为 真 ， 如 采 为 真 则 继续 判定 右 操作 数 ， 如 有 宁 左 右 两 个 操作 数 都 为 
真 ， 那 么 计算 结果 为 真 ， 否 则 计算 结果 为 假 。 但 如 果 左 操作 数 表达 式 
的 值 为 假 ， 那 么 直接 得 到 为 假 的 结果 ， 而 不 会 再 去 计算 右 操作 数 。 


@ 逻 辑 或 也 是 一 个 双 目 操作 符 ， 其 计算 过 程 是 先 判 定 左 操作 数 的 
值 是 否 为 真 ， 如 采 为 真 则 直接 得 到 为 真 的 结 采 ， 而 不 会 再 去 计算 右 操 
作 数 。 如 果 左 操作 数 表达 式 的 值 为 假 ， 那 么 再 去 判定 右 操作 数 ， 如 采 
右 操 作 数 的 值 为 真 ， 那 么 结 采 为 真 ， 如 采 其 值 为 假 ， 那 么 结果 为 假 。 


@ 逻 辑 非 是 一 个 单 目 操作 符 ， 如 果 其 操作 数 表达 式 为 真 ， 那 么 结 
果 为 假 ， 否 则 结 末 为 真 。 这 个 操作 其 实 束 是 对 操作 数 取 逻辑 非 ， 也 就 
相当 于 我 们 日 党 逻辑 中 对 某 一 陈述 的 否定 。 


下 面 我 们 看 一 下 代码 请 单 5-20 所 举 的 一 些 例子 。 


代码 清单 5-20 关系 操作 符 与 逻辑 操作 符 


#include <stdio.h> 
#include <stdbool.h> 


int main(void) 
int x = 0, y = 0; 


// 这 里 由 于 x < 9 的 结果 为 假 ， 所 以 直接 得 到 b 为 假 。 
// ++y > 0 这 一 表达 式 不 会 被 计算 


bool b=x<0 && +ty > 0 


// 输出 : b = 0, y= 0 
printf("b = %d, y = %d\n", b, y); 
// 这 里 由 于 y = 所 以 直接 得 到 b 为 真 。 


] = 0 的 结果 为 真 ， 
// - -X > 6 这 一 表达 式 不 会 被 计算 
y --X > 0; 
// 输出 : b = 1, x=0 
printf("b = %d, x = %d\n", b, x); 


// 输出 : !b = 0 
printf("!b = %d\n", !b); 


5.4.5” 移 位 控 作 符 


之 前 在 2.9 忆 为 大 家 介绍 了 移 位 操作 。 在 C 语 言 标准 中 将 移 位 操作 
也 称 为 “ 按 位 移 位 操作 ”， 并 且 没 有 明确 指定 移 位 操作 用 的 是 算术 移 位 
还 是 逻辑 移 位 。C 语 言 中 使 用 << 操 作 符 表 示 左 移 操作 ， 使 用 >> 操 作 符 
表示 右 移 操 作 ， 它 们 都 是 双 目 操作 符 ， 并 且 其 左右 操作 数 都 必须 是 整 
数 类 型 。a<<b 表 示 对 整数 a 向 左 移 b 位 ，a>>b 表 示 对 整数 a 向 右 移 b 位 。 
C 语 言 标准 中 明确 声明 了 ， 如 果 移 位 操作 的 右 操 作 数 为 负数 ， 或 者 右 
操作 数 的 值 大 于 等 于 左 操作 数值 的 位 宽 ( 即 由 多 少 个 比特 构成 ， 那 
么 行为 是 未 定义 的 。 比 如 ， 在 一 般 32 位 系统 环境 下 ，1<<-1、2>>32 这 
些 移 位 操作 的 结 采 都 是 未 定义 的 。 而 当前 主流 C 语 言 编译 需 的 移 位 行 
为 都 直接 与 当前 所 运行 的 处 理 器 的 移 位 特性 相关 。 也 就 是 说 ， 处 理 器 
如 何 处 理 移 位 的 右 操 作 数 为 负数 ， 或 者 右 操作 数 的 数值 大 于 等 于 左 操 
作 数 位 宽 的 情况 ， 那 么 计算 结果 就 如 此 被 处 理 执行 。 关 于 这 点 ， 各 位 
可 以 回顾 一 下 2.9 丰 中 的 相关 内 容 。 当 然 ， 对 于 未 定义 行为 的 情况 我 们 


还 是 需要 慎重 对 符 ， 应 当 尽 量 避 免 移 位 的 右 操作 数 为 负数 的 情况 ， 以 
及 石 操 作 数 的 数值 大 于 等 于 左 操 作 数 位 宽 的 情况 。 


不 过 当前 主流 编译 器 以 及 大 部 分 藤 入 式 系统 相关 的 C 语 言 编译 右 
仍然 区 分 了 逻辑 右 移 与 算术 右 移 。 对 于 右 移 操作 ， 采 用 的 是 算术 右 移 
还 是 逻辑 右 移 主要 看 右 移 操作 的 左 操作 数 ， 即 移 位 操作 对 象 。 如 采 左 
操作 数 是 市 符号 整数 类 型 ， 那 么 采用 的 是 算术 右 移 ， 如 琳 是 无 符号 整 
数 类 型 ， 那 么 采用 的 是 逻辑 右 移 。 我 们 看 一 下 代码 清单 5-21 的 例子 。 


代码 清单 5-21 移 位 操作 


#include <stdio.h> 
int main(void) 


int a = 1; 
unsigned b = 1; 


// 相当 于 a = a << 2， 将 带 符号 整数 对 象 a 向 左 移 2 位 ， 结 果 为 4 
a <<= 2; 
// 相当 于 b = b << 3， 将 无 符号 整数 对 象 b 向 左 移 3 位 ， 结 果 为 8 
b <<= 3; 


printf("a = %d, b = %d\n", a, b); 


// 当前 a 的 值 用 十 六 进 制 表示 为 : 9xfffffff6 


a = -10; 
b = Oxfffffff6; 
// 相当 于 a = a >> 30， 由 于 a 是 带 符号 整数 ， 所 以 这 里 做 的 是 算术 右 移 


a >>= 30; 

// 相当 于 b = b >> 30， 由 于 b 是 无 符号 整数 ， 所 以 这 里 做 的 是 逻辑 右 移 
b >>= 30 

// 输出 : a = -1, b=3 

printf("a = %d, b = %d\n", a, b); 


我 们 从 代码 清单 5-21 可 以 看 到 ， 带 符号 整数 a 在 做 右 移 的 时 候 ， 高 
位 填充 的 是 符号 位 ， 所 以 采用 的 是 算术 右 移 ， 结 果 为 -1。 而 无 符号 整 
数 b 在 做 右 移 的 时 候 ， 高 位 填充 的 是 0， 所 以 采用 的 是 逻辑 右 移 ， 结 果 
为 3。 


5.4.6 ” 圆 丘 号 操作 符 


辆 括号 操作 符 主要 用 于 提升 其 操作 数 表 达 式 的 计算 优先 级 ， 并 且 
能 将 其 操作 数 与 其 他 操作 符 进行 分 阳 。 带 有 加 括号 操作 符 的 表达 式 称 
为 圆 括号 表达 式 (Parenthesized Expression) ， 它 属于 基本 表达 式 ， 这 
也 十 计 算 优 先 级 最 高 的 表达 式 。 圆 括号 操作 符 有 一 个 很 历 害 的 特性 
征 ， 其 操作 数 表达 式 可 以 是 一 个 左 值 ， 然 后 将 得 到 的 结 采 表达 式 也 作 
为 一 个 左 值 ， 并 可 对 它 进行 修改 。 关 于 左 值 的 概念 可 参见 14.4 条 。 我 
们 下 面 举 一 些 简单 的 例子 ， 介 绍 一 下 圆 括号 操作 符 ( 见 代码 清单 5- 
22) 。 由 于 它 使 用 起 来 非常 目 然 ， 一 般 来 说 与 我 们 在 数学 上 用 于 计算 
式 中 的 效果 类 似 ， 所 以 不 做 过 多 摘 述 。 


代码 请 单 5-22 ” 圆 括号 操作 符 


#include <stdio.h> 
int main(void) 
int a = 10; 


// 这 里 使 用 圆 括号 操作 符 提升 a + 1 子 表达 式 的 优先 级 
a= (a+1) * 2; 


至 


// 这 里 对 对 象 a 使 用 圆 括号 操作 符 尽管 没有 
// 这 里 相当 于 : int b = a; 
int b = (a); 


// 这 里 输出 : a = 22, b = 22 
printf("a = %d, b = %d\n", a, b); 


int *p = (int[]) { 1, 2}; 


实际 意义 ， 但 也 完全 合法 。 


// 这 里 p + 1 子 表达 式 不 是 左 值 ， 但 *(p + 1) 子 表达 式 却 是 一 个 左 值 ， 
// 然后 (*(p + 1) ) 子 表达 式 也 是 一 人 大 值 所 以 可 以 对 它 做 增 操作 
(*(p + 1))++; 

// 输出 : p[1] = 3 

printf("p[1] = %d\n", p[1]); 


5.5 ”sizeof 控 作 符 


sizeof 属 于 单 日 操作 符 ， 其 语法 形式 为 : 
1) sizeof 单 目 表 达 式 
2) sizeof (类 型 名 ) 


sizeof 操 作 符 返回 其 操作 数 的 大 小 ( 即 占用 多 少 字 广 ) ， 用 一 个 整 
数值 来 表示 ， 一 般 C 语 言 实 现 都 用 size_t 来 表示 sizeof 操 作 符 的 返回 类 
型 。 如 果 sizeof 的 操作 数 是 一 个 可 变 修改 类 型 (将 在 7.3 节 中 介绍 ) 的 
表达 式 ， 那 么 该 操作 数 需 要 在 运行 时 计算 ; 否则 sizeof 仅 仅 在 编译 时 对 
操作 数 的 类 型 进行 获取 ， 而 不 会 去 计算 操作 数 所 对 应 的 整个 表达 式 的 
结果 。 也 就 古 说 C 语 言 实现 在 这 种 情况 下 只 需要 生成 对 应 sizeof 操 作 符 
的 结果 相关 代码 ， 而 无 需 生 成 作为 sizeof 操 作 数 的 表达 式 的 代码 。 


下 面 举 一 些 例子 来 帮助 各 位 理解 ， 如 代码 清单 5-23 所 示 。 


代码 清单 5-23 ”sizeof 操 作 符 


#include <stdio.h> 
int main(int argc, const char * argv[]) 


int a = 10; 


. 这 里 候 Eargc 为 1，array 是 一 个 变 长 数组 
和 度 需 要 在 运行 时 通过 变量 argc 与 a 相 加 获得 
i rl + argc]; 


// 这 里 将 会 对 array 的 大 小 在 运行 时 做 计算 


size_t Size = sizeof(array); 


printf("size = %zu\n", size); // 输出 44 
size = sizeof(++a); 


a 


printf("size = %zu, a = %d\n", size, a); // a 仍然 为 10，++a 没 有 被 执行 


double d = 10.05,; 


size = sizeof d; // Sizeof 操 作 符 可 以 不 加 括号 ， 但 前 提 是 操作 数 是 单 目 表 达 式 
printf("sizeof d = %zu\n", size); // 输出 8 


size = sizeof d + sizeof a,; 
printf("size = %zu\n", size); // 输出 12 


在 代码 清单 5-23 中 涉及 的 数组 概念 ， 我 们 将 在 第 7 草 重 点 描述 。 此 
外 ， 尽 管 C 语 言 允 许 我 们 可 以 使 用 不 带 圆 括号 的 sizeof 操 作 符 ， 但 笔者 
这 里 建议 各 位 加 上 圆 括号 ， 这 样 会 使 得 代码 更 为 和 直观， 也 不 会 受到 其 
他 中 级 表达 式 的 干扰 。 本 书后 续 章 世 中 所 涉及 的 sizeof 操 作 符 都 将 带 有 
圆 括 号 。 


5.6 投 届 操 作 符 


投 喘 操 作 符 (Cast Operator) 的 语法 很 简单 ， 就 是 在 圆 括号 中 放 
上 类 型 名 ， 用 于 修饰 一 个 表达 式 。 它 与 圆 括号 操作 符 的 区 别 在 于 ， 圆 
括号 操作 符 中 是 将 表达 式 作为 其 操作 数 ， 而 投射 操作 符 则 是 在 加 括号 
中 放 类 型 名 。 投 射 操作 符 是 一 个 单 目 操作 符 ， 这 里 被 修饰 的 表达 式 作 
为 投射 操作 的 操作 数 。 投 射 操作 的 实际 侣 义 是 : 将 一 个 表达 式 的 类 型 
投 冉 为 该 投 味 操 作 符 所 指定 的 类 型 ， 这 个 动作 也 被 称 为 类 型 投 冉 
(Type Casting) 。C 语 言 标准 为 何 用 “投射 ”这 个 词 ， 而 不 是 直接 用 “ 转 
换 ” (type conversion) 呢 ? 因 为 这 里 面 其 实 率 涉 两 个 动作 ， 首 先 根 据 
当前 表达 式 的 内 容 找 贝 出 一 个 临时 对 象 ， 然 后 将 该 临时 对 象 做 目标 类 
型 的 转换 以 及 值 的 调整 。 因 此 整个 投 映 操 作 过 程 其 实 是 隐 式 地 创建 了 
一 个 临时 对 象 ， 然 后 我 们 后 续 的 操作 部 是 针对 该 临时 对 象 进行 的 ， 与 
原始 表达 式 无 关 。 这 束 类 似 湖 周围 的 树 通 过 阳光 投 冉 到 湖面 中 的 倒 
影 。 树 束 类 似 原 始 表 达 式 ， 倒 有 影 束 好 比 临 时 对 象 ， 它 们 属于 两 个 不 同 
的 对 象 。 


我 们 了 解 了 这 个 概念 之 后 就 能 对 为 何 投 里 表达 式 不 能 作为 左 值 
(我 们 将 在 14.4 节 中 介绍 ) 做 出 合理 的 解释 了 。 一 般 C 语 言 教科 书 中 把 
投射 操作 称 为 “类 型 转换 ”是 不 严谨 的 。 我 们 可 以 先 简 单 看 一 下 代码 清 
单 5-24 的 例子 。 


代码 清单 5-24 投射 表达 式 不 能 作为 左 值 


#include <stdio.h> 


int main(int argc, const char * argv[]) 


(CShort)i)+?; // 这 名 是 非法 的 ， 对 投射 表达 式 不 能 做 自修 改 操作 


short *sp = &(short)i; // el 对 非 左 值 不 能 取 其 地 址 
(short)i += 10; 对 左 值 进行 投射 操作 一 般 也 是 非法 的 


printf("*sp = %d\n" *sp); 


代码 清单 5-22 展 示 了 对 一 个 投 味 表 达 式 做 赋值 计算 十 非法 的 ， 取 
其 地 址 也 是 非法 的 。 而 且 C 语 言 标 准 也 明确 指出 ， 一 个 投射 表达 式 将 
不 会 产生 一 个 左 值 。 尽 管 C 语 言 标 准 中 没有 指明 投射 操作 的 操作 数 是 
否 可 以 古 一 个 左 值 ， 但 在 主流 C 语 言 编译 局 中 这 十 非 法 的 。 


然而 有 趣 的 是 ， 在 Visual Studio 中 的 MSVC 编 译作 上 ， 代 码 清 单 5- 
22 的 代码 能 正常 通过 编译 运行 。 因 此 ，MSVC 编 译 器 对 投射 操作 放宽 
了 限制 ， 使 得 它 更 像 是 单纯 的 “类 型 转换 ”"， 仿 佛 丢 弃 了 投 映 操 作 。 不 
过 C 语 言 标准 中 明确 规定 : 一 个 投 映 操作 不 产生 左 值 ， 而 对 非 左 值 做 
自 增 、 取 地 址 等 操作 本 吴 就 是 非法 的 ， 所 以 这 也 是 为 何 笔者 不 赞成 各 
位 使 用 Visual Studio 目 带 的 MSVC 编 译 絮 来 写 C 语 言 的 主要 原因 ， 它 对 
标准 的 支持 不 仅 有 限 ， 而 且 还 违背 7 了 一些 基 本 原则 ， 因 此 笔者 更 推荐 
各 位 使 用 VS-Clang 编 译 器 。 


最 后 ， 我 们 再 简单 讲 一 下 C11 标 准 对 投射 操作 符 的 约束 。 


1) 用 于 投射 操作 的 类 型 名 应 该 指定 一 个 标量 类 型 ， 即 非 数 组 类 
型 ， 并 且 可 以 对 该 类 型 添加 _Atomic、const、volatile 等 限定 符 ， 用 于 
投射 操作 的 类 型 名 也 可 以 指定 void 类 型 (详细 请 见 7.9 节 内 容 ) 。 而 投 
射 操 作 的 操作 数 应 该 具有 标量 类 型 。 


2) 涉及 指针 类 型 的 转换 ， 除 了 某 些 允许 指针 类 型 隐 式 转换 的 情 
况 ， 应 该 显 式 使 用 投射 操作 。 


3) 指针 类 型 不 应 该 被 转换 为 任 一 浮 点 类 型 ， 浮 点 类 型 也 不 应 该 被 
转换 为 任 一 指针 类 型 。 


比如 int* 不 能 转换 为 float 类 型 ，double 类 型 也 不 能 转换 为 double* 类 


型 。 


5.7 ”本章 小 结 


本 章 介绍 了 C 语 言 中 第 用 的 基本 类 型 ， 包 括 整 数 类 型 、 字 符 类 型 
以 及 浮 点 数 类 型 ， 同 时 介绍 了 第 用 的 基本 算术 逻辑 计算 、 目 增 目 城 操 
作 、 按 位 操作 、 人 逻辑 操 作 等 。 最 后 还 讲 了 我 们 第 用 的 sizeof 操 作 符 以 及 
投 丑 操作 符 。 


这 里 各 位 要 注意 的 是 整数 类 型 及 其 相关 表示 的 范围 是 根据 特定 处 
理 套 以 及 特定 操作 系统 环境 来 决定 的 。 当 然 ， 本 章 中 也 列举 了 利用 的 
32 位 系统 以 及 64 位 系统 中 各 种 整数 类 型 所 表示 的 数值 范围 。 其 次 ， 目 
增 目 城 操作 的 操作 顺序 需要 各 位 好 好 理解 ， 这 需要 多 实践 ， 当 然 这 里 
也 不 建议 各 位 把 目 增 目 减 操 作 写 得 过 于 复杂 ， 否 则 会 影响 代码 的 可 理 
解 性 。 此 外 ， 笔 者 还 推荐 各 位 将 关系 操 作 符 、 相 等 性 操作 符 以 及 逻辑 
操作 符 的 结果 类 型 视 作 布 尔 类 型 ， 这 样 能 提升 代码 的 逻辑 性 与 可 读 
性 。 最 后 ， 本 书 也 淤 清 了 类 型 投 冉 的 问题 ， 它 不 单单 古 一 种 类 型 转 
换 ， 然 后 描述 了 投射 过 程 概念 上 的 逻辑 。 


第 6 章 ”用 户 目 定义 类 型 


本 章 我 们 将 介绍 C 语 言 中 的 用 户 目 定义 类 型 。 通 过 用 户 目 定义 类 
型 ， 我 们 可 以 把 一 些 数 据 高 度 抽象 化 ， 从 而 能 够 把 这 些 数 据 信 息 组 织 
成 为 我 们 概念 上 更 易于 理解 的 模型 。 例 如 ， 我 们 可 以 定义 一 个 用 于 学 
籍 管理 的 “学 生 信 息 ? 类 型 ， 或 是 定义 一 个 可 用 于 表示 交通 灯 : 红 灯 、 
黄 灯 、 绿 灯 这 三 种 状态 的 数据 类 型 ， 等 等 。 本 章 还 会 介绍 C11 标 准 对 
复数 (Complex Number) 类 型 的 支持 。 


6.1 枚 举 类 型 


枚 举 (enumeration) 类 型 一 般 用 于 表示 离散 有 限 有 个 数值 的 数据 
对 象 。 比 如 刚才 提 到 的 交通 灯 的 3 种 颜色 的 灯 ， 阳 光 可 被 分 离 的 7 种 颜 
色 的 光 ， 一 颗 骨 子 上 的 6 种 点 的 花色 ， 等 等 。 声 明 一 个 枚 举 的 一 般 形 式 
如 下 : 


enum ”标识 符 { 枚 举 符 列表 } 


以 上 这 种 声明 枚 举 的 形式 可 以 完整 地 称 为 枚 举 说明 符 (enum- 
specifier) 。 其 中 ， 枚 举 标识 符 在 C 语 言 标准 中 又 被 称 为 枚 举 标 签 
(tag) 。 枚 举 符 列表 由 一 个 个 枚 举 符 (enumerator) 构成 ， 而 一 个 枚 
举 符 则 是 一 个 枚 举 常 量 (enumeration constant) ， 或 带 有 一 个 常量 表 


达 式 的 枚 举 和 常量 。 下 面 我 们 先 举 一 些 简单 例子 ， 请 看 代码 清单 6-1: 


代码 清单 6-1 枚 举 类 型 介绍 


// 声明 一 个 名 为 LIGHT 的 枚 举 类 型 
enum LIGHT; 


// 定义 了 一 个 名 为 TRAFFIC_LIGHT 的 枚 举 类 型 
enum TRAFFIC_LIGHT 


TRAFFIC_LIGHT_RED， // 0 


TRAFFIC_LIGHT_YELLOW, //1 
TRAFFIC_LIGHT_GREEN // 2 

}; 

// 定义 了 一 个 名 为 LIGHT 的 枚 举 类 型 

enum LIGHT 
LIGHT_RED = -2， // -2 


LIGHT_ORANGE, // -1 


LIGHT_YELLOW = 1, //1 


LIGHT_GREEN, // 2 
LIGHT_BLUE, // 3 
LIGHT_INDIGO = LIGHT_RED + -100, // -102 
LIGHT_PURPLE // -101 


// 一 个 枚 举 符 列表 的 末尾 可 加 一 个 逗号 ， 这 便于 用 程序 自动 生成 C 语 言 代 码 


在 代码 清单 6-1 中 ，TRAFFIC_LIGHT 和 LIGHT 都 是 枚 举 标签 ， 我 
们 一 般 就 称 为 枚 举 标 识 符 或 枚 举 名 。 像 TRAFFIC_LIGHT_RED 以 及 
LIGHT_RED=-2 等 都 是 枚 举 符 。 而 像 TRAFFIC_LIGHT_RED 以 及 
LIGHT_RED 等 都 属于 枚 举 常量 。 枚 举 符 列表 中 的 每 一 个 枚 举 常量 都 被 

声明 为 具有 int 类 型 的 常量 。 如 有 果 枚 举 符 常量 带 有 一 个 常量 表达 式 ， 那 
么 该 表达 式 的 类 型 必须 与 int 兼 容 ， 同 时 ， 该 常量 表达 式 的 值 将 作为 该 
枚 举 常 量 的 值 〈 比 如 LIGHT_RED) 。 如 果 第 一 个 枚 举 常 量 不 带 有 常量 
表达 式 ， 那 么 其 值 默 认为 0 (比如 TRAFFIC_LIGHT_RED) 。 对 于 之 
后 的 所 有 枚 举 常 量 ， 如 果 它 没有 常量 表达 式 为 它 赋值 ， 那 么 该 枚 举 常 
量 的 值 为 它 前 一 个 枚 举 常量 的 值 加 1 (比如 LIGHT_ORANGE) 。 一 个 
枚 举 中 的 枚 举 符 也 被 称 为 该 枚 举 的 成 员 。 比 如 ，TRAFFIC_LIGHT 枚 
举 类 型 束 有 三 个 枚 举 成 员 ， 分 别 是 TRAFFIC_LIGHT_RED 、 


TRAFFIC_ LIGHT_YELLOW 和 TRAFFIC_ LIGHT_GREEN 。 


像 代码 清单 6-1 中 所 声明 的 “enum LIGHT; ”以 及 “enum 
TRAFFIC_LIGHT{TRAFFIC_LIGHT_RED, 
TRAFFIC_LIGHT_YELLOW，TRAFFIC_LIGHT_GREEN}; ”这 整 段 
代码 就 称 为 枚 举 说 明 符 。 


每 个 枚 举 类 型 应 该 与 char、 一 个 市 符号 整数 类 型 或 一 个 无 符号 整 
数 类 型 相 兼 容 。 具 体 对 于 枚 举 类 型 使 用 哪 种 整数 类 型 是 由 实现 定义 
的 。 比 如 ， 在 ADS1.2 开 发 环境 中 ， 枚 举 类 型 被 默认 定义 为 与 unsigned 
char 类 型 兼容 ， 而 在 当前 主流 介面 C 语 言 编译 硕 中 ， 枚 举 类 型 默认 为 与 
int 类 型 相 兼 容 。 注 意 ， 这 里 说 的 是 枚 举 类 型 ， 而 不 古 枚 举 第 量 的 类 


型 。 


要 声明 一 个 枚 举 类 型 的 对 象 ， 需 要 天 键 字 enum 加 枚 举 标识 符 一 起 
来 声明 。 代 码 清单 6-2 曾 明了 如 何 定 义 、 使 用 枚 举 对 象 : 


代码 清单 6-2 声明 及 使 用 枚 举 对 象 


#include <stdio.h> 
#include <stdint.h> 
// 定义 了 一 个 名 为 TRAFFIC_LIGHT 的 枚 举 类 型 
enum TRAFFIC_LIGHT 


TRAFFIC_LIGHT_RED， // 0 
TRAFFIC_LIGHT_YELLOW, //1 
TRAFFIC_LIGHT_GREEN // 2 
} g_traffic; // 定义 了 一 个 全 局 的 enum TRAFFIC_LIGHT 变 量 g_traffic 
// 定义 了 一 个 名 为 LIGHT 的 枚 举 类 型 
static enum LIGHT 


{ 
LIGHT_RED = -2， // -2 
LIGHT_ORANGE, // -1 
LIGHT_YELLOW = 1, //1 
LIGHT_GREEN, // 2 
LIGHT_BLUE, // 3 
LIGHT_INDIGO = LIGHT_RED + -100, // -102 
LIGHT_PURPLE // -101 
// 定义 了 一 个 静态 的 enum LIGHT 变 量 s_light 
// LIGHT_BLUE 枚 举 常 量 对 其 初始 化 

} s_light = LIGHT_BLUE; 

// 匿名 枚 举 

enum 

{ 
DICE_ONE = 1, 
DICE_TwO, 
DICE_THREE, 
DICE_FOUR, 
DICE_FIVE, 


DICE SIX 本 
// 定义 了 一 个 匿名 枚 举 类 型 ， 并 用 它 定义 了 一 个 全 局 变量 g_dice 


} g_ dice = DICE_TWO 


int main(int argc, const char * argv[]) 


{ 


// 定义 了 enum TRAFFIC_LIGHT 的 变量 traffic， 这 里 的 enum 不 能 省 ， 
// 并 对 它 用 TRAFFIC_LIGHT_YELLOW 枚 举 常量 对 其 初始 化 

enum TRAFEICELIGHT traffic = TRAFFIC_LIGHT_YELLOW; 
g_traffic = TRAFFIC_LIGHT_GREEN; 
printf("traffic = %d, g_ Te = 
// 枚 举 变 量 也 可 以 进行 算术 运 侦 ， 尽 管 并 不 推荐 这 么 做 
g_dice += 2; 
// 一 个 枚 举 变量 也 能 赋值 给 一 个 整数 变量 
Int32 ta = gd dice; 
// 一 个 整数 变量 也 能 赋值 给 一 个 枚 举 变量 ， 尽 
// 此 时 1ight 变 生 不 是 任 一 其 效 的 和 举 党 重 
enum LIGHT light = a; 

printf("light is: %d\n", light); 

a += DICE_ONE; 

printf("Is a == DICE_FIVE? %d\n", a == DICE_FIVE); 
printf("light = %d\n", s_light + LIGHT T_PURPLE); 

// 在 画 数 内 定义 一 个 枚 举 类 型 
enum SOME_ENUM 


不 推荐 这 么 做 。 


本 天 


SOME_ENUM1, 

SOME_ENUM2, 

SOME_ENUM3 
}se = SOME_ENUM1; 
// 将 (se + 2) 的 结果 类 型 显 式 续 换 为 enum SOME_ENUM 类 型 
enum SOME_ENUM se2 = (enum SOME_ENUM)(se + 2); 
printf("se2 = %d\n", se2); 


%d\n", traffic, g_traffic); 


6.2 ”结构 体 类 型 


C 语 言 中 的 结构 体 (structure) 是 对 一 组 数据 元 素 的 有 序 组 织 。 通 
过 结构 体 ， 我 们 可 以 建立 丰 宦 多 彩 的 数据 结构 ， 对 现实 世界 建立 概念 
模型 。 在 结构 体 中 我 们 可 以 存放 任意 类 型 的 数据 元 素 ， 包 括 整 数 类 
型 、 浮 点 类 型 、 枚 举 类 型 ， 甚 至 藤 套 其 他 结构 体 类 型 。C 语 言 标准 叉 
将 数组 和 结构 体 称 为 聚合 (aggregate) 类 型 。 要 定义 一 个 结构 体 类 
型 ， 我 们 使 用 关键 字 struct， 后 面 紧 跟 的 标识 符 束 作为 该 结构 体 的 类 型 
名， 该 类 型 名 在 C 语 言 标准 中 又 称 为 此 结构 体 的 标签 \tag) 。 结 构 体 
类 型 既 可 以 定义 在 文件 作用 域 ， 也 可 以 定义 在 函数 中 。 


6.2.1 ”结构 体 概述 


结构 体 类 型 的 一 般 定义 形式 为 : 


struct 标识 符 可 省 《 结构 体 声 明 列 表 } 


结构 体 声 明 列表 由 各 个 声明 (包括 静态 断言 声明 ) 构 成。 静态 断 


言 将 在 14.3 闻 中 详细 介绍 。 


代码 清单 6-3 展 示 了 结构 体 类 型 的 声明 以 及 定义 。 


代码 清单 6-3 ”结构 体 声明 符 


#include <stdio.h> 

#include <stdint.h> 

// 声明 了 一 个 名 为 StructTest 的 结构 体 
struct StructTest 


enum MyEnum 
MY_ENUM1, 
MY_ENUM2 
}; 


// 定义 了 一 个 名 为 MyStruct 的 结构 体 
struct MyStruct 


// 声明 了 MyStruct 的 一 个 jnt32_t 类 型 成 员 a 
int32 t a; 


// 声明 了 一 个 MyStruct 的 一 个 enum MyEnum 类 型 成 员 e 
enum MyEnum e; 


// 声明 了 MyStruct 的 一 个 double 类 型 成 员 d 
double d; 


了 


// 声明 了 指向 struct StructTest 类 型 的 指针 成 员 pTest 
struct StructTest *pTest 


// 用 一 个 静态 断言 作为 声明 ， 但 不 5 用 此 结构 体 对 象 的 存储 空间 
_Static eM ENUM1 == ©, "NG"); 


}; 


// 定义 结构 体 StructTest 
struct StructTest 
{ 


// 声明 了 StructTest 的 一 个 jnt16_t 类 型 成 员 s 
int16_t s; 


// 声明 了 StructTest 的 一 个 struct MyStruct 类 型 成 员 m 
struct MyStruct m; 


// 声明 了 StructTest 中 的 一 个 匿名 结构 体 
Struct { 

Int32 t a, b; 

float f; 

; // 结构 体 声 明 列 表 末尾 允许 包含 一 个 分 号 ， 便 于 程序 自动 生成 C 语 言 代码 
}i; // 直接 a 


en 


}; 


代码 清单 6-3 中 ，StructTest 以 及 MyStruct 就 是 结构 体 标 签 ， 我 们 一 
般 就 称 为 结构 体 标 识 符 或 结构 体 名 。 像 struct StructTest; ”这 种 对 
StructTest 结 构 体 的 声明 以 及 后 面 对 StructTest 的 整个 定义 (从 {到 }; ) 


就 称 为 结构 体 说 明 符 。 而 像 struct MyStruct 里 {} 中 的 “int a; “ 则 作为 结 

构 体 中 的 声明 ， 其 中 a 就 作为 MyStruct 结 构 体 的 成 员 。“_Static_assert 
(MY_ENUM1==0, “NG”) ; ”这 条 语句 就 是 静态 断言 ， 如 果 各 位 把 

这 条 语句 中 的 0 改 为 1 的 话 ， 在 编译 时 就 会 报错 ， 报 错 信息 为 "NG”。 


在 结构 体内 除了 可 定义 基本 类 型 对 象 作为 其 成 员 之 外 ， 还 可 定义 
枚 举 、 结 构 体 等 用 户 自 定义 数据 类 型 对 象 。 比 如 ， 在 MyStruct 中 的 成 
员 e， 以 及 在 StructTest 中 的 成 员 m、i 等 。 


C 语 言 中 可 以 定义 匿名 结构 体 类 型 ， 即 结构 体 的 标识 符 可 缺 省 。 
我 们 在 代码 清单 6-1 中 最 后 儿 行 能 看 到 在 MyStruct 内 定义 了 一 个 匿名 结 
构 体 类 型 ， 并 用 它 声明 了 对 和 象 i。 匿名 结构 体 通 肖 无 法 被 直接 引用 ， 所 
以 我 们 只 能 通过 直接 在 它 后 面 声明 该 类 型 的 对 象 或 指 同 该 结构 体 类 型 
的 指针 进行 使 用 。 


6.2.2 ”用 结构 体 创建 对 象 并 访问 其 成 员 


上 面 我 们 讲述 了 结构 体 类 型 的 声明 和 定义 。 下 面 我 们 将 在 代码 清 
单 6-4 中 描述 如 何 用 结构 体 声明 对 象 并 对 它们 进行 初始 化 ， 以 及 如 何 访 
问 结构 体 的 成 员 。 


代码 清单 6-4 ”结构 体 对 象 的 声明 、 初 始 化 以 及 成 员 访问 


#include <stdio.h> 


// 声明 了 一 个 名 为 MyPoint 的 结构 体 


static struct MyPoint 


float x, y; 
}g_point;  ”// 然后 立即 声明 g_point 对 象 ， 其 成 


竺 程序 加 载 完 之 后 被 初始 化 为 堆 


= 


int main(int argc, const char * argv[]) 


// 在 main 函 数 中 声明 了 对 象 poijnt， 但 没有 对 它 做 显 式 的 初始 化 
struct MyPoint point; ”// 此 时 ，point 的 x 和 y 成 员 对 象 的 值 都 是 不 确定 的 


| 一 个 结构 体 对 象 中 的 某 个 成 员 使 用 “. “访问 操作 符 
("g_point.x = %f, g_point.y = %f\n", g_point.x, g_point.y); 


Sm 


// 访 
print 


问 

f 
// 结构 体 对 象 标识 符 、， 访问 操作 符 ， 以 及 成 员 对 象 标识 符 间 都 可 以 用 空白 符 分 隔 。 但 习惯 上 
// 我 们 更 偏向 于 直接 7 结构 体 对 象 标识 符 ,结构 体 成 员 对 象 ? ' 这 种 样式 ， 中 间 都 不 包含 任何 空 
printf("point.x = %f, point.y = %f\n", point .x, point . y); 


// 声明 一 个 指向 MyPoint 结 构 体 类 型 的 指针 ， 并 将 它 初始 化 为 指向 point 对 象 的 地 址 
struct MyPoint *pPoint = &point; 


// 访问 一 个 指向 结构 体 指针 的 对 象 ， 使 用 “->” 操 作 符 
pPoint->x = 100.0f; // 此 时 ，point .x 的 值 也 变 为 了 100 .0f 
printf("point.x = %f\n", point.x); 


// 用 MyPoint 结 构 体 声明 了 point2 对 象 ， 并 对 它 显 式 初 始 化 

// 对 一 个 结构 体 对 象 显 式 初始 化 使 用 一 个 大 括号 ， 私访 家中 拍 明 该 结构 体 对 应 成 员 的 值 
// 这 里 ，point2 .x 被 初始 化 为 l00 .6f，point2.y 被 初始 化 为 50 . Of 

struct MyPoint point2 = { 100.0f, 50.0f }; 

printf("point2.x = %f, point2.y = %f\n", point2.x, point2.y); 


// 结构 体 对 象 允许 直接 用 等 号 赋值 ， 此 时 C 语 言 实现 会 直接 将 此 赋值 操作 拆 分 为 
// 依次 用 “=" 右 操 f FE 数 的 结构 体 成 员 对 象 的 值 赋值 给 = 左 操作 数 结构 体 成 员 对 象 的 值 ， 
// 不 过 各 个 成 员 员 对 象 的 赋值 执行 次 序 是 由 实现 定义 的 ， 

// 未 必 严 格 按 照 成 员 对 象 在 结构 体 中 定义 的 顺 / 序 进行 

point = point2; // 此 表达 式 相 当 于 point.x = point2.x; point.y = point2.y; 
printf("point.x = %f, point.y = %f\n", point.x, point.y); 


// 在 main 画 数 中 定义 名 为 MyRectangle 的 结构 体 
struct MyRectangle 


enum { 
COLOR_RED, 
COLOR_GREEN, 
ee BLUE 
// 这 里 定义 了 一 个 匿名 枚 举 类 型 接 用 它 声 明 枚 举 对 象 color 
// 什 M Ractamolcl 个 让 
}color; 


struct MyPoint position; 


Struct 区 
float width, height; 
// 这 里 定义 了 一 个 匿名 结构 体 ， 接 用 它 声 明 结 构 体 对 象 Ssize 


// 作为 MyRectangle 的 一 个 成 员 
}size,; 


// 这 里 直接 用 MyRectang1e 结 构 体 类 型 声明 了 一 个 对 象 rect， 并 对 它 直接 做 初始 化 。 
// 在 初始 化 过 程 中 依次 对 其 成 员 color、position 以 及 匿名 结构 体 对 象 size 进 行 初 始 化 
} rect = { COLOR_RED，10.0f，20.0f，90.0f，35.0f }, 


// 然后 再 直接 用 MyRectangle 结 构 体 类 型 声明 了 一 个 对 象 rect2， 接 对 它 进行 初始 化 。 
// 这 里 在 对 position 以 及 Size 成 员 对 象 初始 化 时 使 用 了 { }， 因 为 它们 也 是 结构 体 类 型 ， 
// 从 而 可 以 对 部 分 成 员 进行 初始 化 为 指定 的 值 。 
// 这 里 ， 仅 对 成 员 position 对 象 中 的 x 成 员 进 行 初始 化 为 39 . 0f; 


// 而 对 其 成 员 Size 对 象 中 的 所 有 成 员 直 接 出 初始 化 为 零 
rect2 = { COLOR_GREEN, { 30.0f }, { } }; 


printf("rect.color = %d, rect.position.x = %f, \ 
rect.position.y = %f, rect.size.width = %f, \ 
rect.size.height = %f\n", rect.color, rect.position.x, 
rect.position.y, rect.size.width, rect.size.height); 


printf("rect2.color = %d, rect2.position.x = %f, \ 
rect2.position.y = %f, rect2.size.width = %f, \ 
rect2.size.height = %f\n", rect2.color, rect2.position.x, 
rect2.position.y, rect2.,size.width, rect2.size.height); 


// 用 MyRectangle 结 构 体 声明 了 对 象 rect3， 并 利用 指定 成 员 的 初始 化 器 对 它 进行 初始 化 。 
// 这 里 ，rect3.color 被 初始 化 为 COLOR_BLUE; rect3.position .x 初始 化 为 0. 0f; 
// rect3.position.y 被 初始 化 为 200 .0f; rect3.size .width 被 初始 化 为 0. 0f; 
// rect3.size.height 被 初始 化 为 50 .0f 
struct MyRectangle rect3 = { .color = COLOR_BLUE， 

.position.y = 200.0f, { .height = 50.0f } }; 


一 


printf("rect3.color = %d, rect3.position.x = %f, 
"rect3.position.y = %f, rect3,size.width = %f, 
"rect3.size.height = %f\n", rect3.color, rect3.position.x, 
rect3.position.y, rect3,size.width, rect3.size.height); 


如 果 一 个 结构 体 类 型 声明 的 对 象 具有 静态 存储 周期 (将 在 11.3 节 
中 介绍 ) 或 线程 存储 周期 (将 在 11.7 节 中 介绍 ) 一 一 比如 代码 清单 6-4 
中 在 文件 作用 域 声 明 的 对 象 g_point， 那 么 该 结构 体 对 象 的 所 有 成 员 在 
执行 main 函 数 前 被 系统 默认 初始 化 为 0。 如 果 一 个 结构 体 对 象 没 有 被 初 
台 化 且 具 有 自动 存储 周期 〈 将 在 11.4 节 介绍 ) ， 那 么 其 成 员 对 象 的 值 
是 未 定义 的 ， 比 如 代码 清单 6-4 中 main 范 数 里 的 第 一 行 语句 。 我 们 在 对 
一 个 结构 体 对 象 初始 化 时 使 用 全 作为 其 初始 化 絮 (initializer) 。 在 全 
中 用 喜 号 分 隔 的 表达 式 为 当前 结构 体 对 象 的 相应 成 员 的 初始 化 釉 ， 可 
依次 对 结构 体 对 象 相应 的 成 员 进 行 初始 化 ， 它 们 也 称 为 结构 体 对 象 的 
初始 化 器 列表 (initializer-list) 。 比 如 代码 清单 6-4 中 的 “struct MyPoint 
point2={100.0f，50.0f}; ”。 其 中 ， 人 里 的 100.0f 与 50.0f 就 是 对 point2 对 
象 成 员 的 初始 化 器 ， 分 别 将 point2 对 象 的 成 员 x 与 成 员 y 初 始 化 为 100.0f 


和 50.0f， 它 们 构成 了 一 个 针对 结构 体 对 象 point2 的 初始 化 器 列表 。 而 
整个 {100.0f，50.0f} 就 是 对 结构 体 对 象 point2 的 初始 化 器 。 如 果 一 个 初 
台 化 中 的 初始 化 器 少 于 当前 结构 体 成 员 的 个 数 ， 那 么 未 被 初始 化 到 的 
成 员 对 象 被 清 零 (也 就 是 说 ， 如 果 未 被 初始 化 到 的 成 员 是 数值 对 象 ， 
那么 被 初始 化 为 0， 如 果 是 指针 类 型 对 象 则 被 置 为 空 ) 。 如 果 一 个 结构 
体 中 还 含有 一 个 结构 体 类 型 的 成 员 ， 那 么 对 它 初始 化 时 ， 其 初始 化 器 
可 用 人 fj} 来 分 隔 其 他 成 员 。 比 如 上 述 代码 中 的 rect2={200，{30.0f} ， 

{}}。 另 外 ， 由 于 在 对 rect2 进 行 初始 化 的 时 候 ， 其 匿名 结构 体 类 型 的 成 
员 对 象 size 没 有 任何 初始 化 器 对 size 的 成 员 进行 初始 化 ， 所 以 size 的 所 
有 成 员 都 为 0。 


要 访问 一 个 结构 体 对 象 的 成 员 ， 使 用 “.” 操 作 符 ， 这 在 C 语 言 标准 
中 称 为 成 员 访 问 操作 符 (member-access operator) ， 它 属于 后 缀 操作 
符 。 各 位 需要 注意 的 是 ， 成 员 访 问 操作 符 是 一 个 单 目 操作 符 ， 其 操作 
数 是 该 操作 符 左边 表示 结构 体 对 象 的 表达 式 ， 而 其 右边 的 结构 体 成 员 
名 则 不 属于 操作 数 。 这 就 类 似 于 投 映 操作 中 () 操作 符 中 的 类 型 也 不 
作为 投射 操作 的 操作 数 一 样 ， 投 射 操作 符 的 操作 数 是 它 后 面 的 表达 
式 。 比 如 代码 清单 6-4 中 的 “printf ("point.x=%f\n"，point.x) ; ”就 是 读 
point 对 象 中 x 成 员 的 值 。 如 果 要 访问 一 个 指向 结构 体 类 型 的 指针 对 
象 ， 那 么 使 用 -> 操作 符 (注意 ，-> 必 须 作 为 整体 ， 即 “-” 与 “>* 之 间 不 能 
存在 任何 空白 符 ) 它 和 操作 符 一 样 ， 也 属于 单 目 后 缀 操作 符 ， 我 们 将 
在 7.6 节 做 详细 介绍 。 比 如 代码 清单 6-4 中 pPoint->x=100.0f; 残 是 将 


100.0f 赋 值 给 pPoint 指 针对 象 所 指 结构 体 对 象 * 即 point 对 象 ) 的 成 员 
x。 我 们 将 在 第 7 章 详细 介绍 指针 对 象 。 此 外 ， 各 位 要 注意 的 

是 ,，“.” 和 “- >” 访问 操作 符 只 能 访问 结构 体 中 的 对 象 成 员 ， 而 不 能 访问 
该 结构 体 中 所 定义 的 类 型 。 


最 后 ， 上 述 代 码 呈 现 了 如 何 使 用 指定 成 员 的 初始 化 右 (designated 
initializer) 来 对 结构 体 成 员 进 行 初始 化 。 这 个 语法 特性 从 C99 开 始 引 
入 ， 因 此 当前 MSVC、VS-Clang、GCC 和 Clang 都 能 支持 。 指 定 成 员 的 
初始 化 器 通过 “.” 操 作 符 来 指定 当前 对 哪个 结构 体 成 员 进行 初始 化 。 而 
且 一 旦 用 了 指定 成 员 的 初始 化 器 ， 对 成 员 的 初始 化 也 无 需 按 照 它们 在 
结构 体 中 的 排列 次 序 进行 。 比 如 ， 我 们 可 以 用 “struct MyPoint point= 
{.y=50.0f，.x=10.0f}; ”对 point 对 象 进行 初始 化 。 其 中 ，“.y=50.0f” 以 
及 “.x=10.0f” 均 为 指定 成 员 的 初始 化 器 。 这 样 一 来 初始 化 完 之 后 ， 
point.x 就 是 10.0f，point.y 为 50.0f 。 


6.2.3 ”结构 体 复合 字面 量 
从 C99 标 准 开 始 对 结构 体 还 引入 了 结构 体 复合 字面 量 (structural 


compound literal) ， 也 称 之 为 “匿名 结构 体 对 象 ”， 可 以 对 某 个 结构 体 
对 象 直接 用 结构 体 字面 量 进行 赋值 。 这 样 对 于 无 法 在 初始 化 阶段 确定 


值 的 结构 体 对 象 而 言 ， 有 了 一 种 新 的 更 简便 的 赋值 方式 ， 而 无 需 通 过 
一 个 临时 结构 体 对 象 ， 如 代码 清单 6-5 所 示 。 


代码 清单 6-5 ”结构 体 复合 字面 量 


#include <stdio.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 


// 定义 了 一 个 结构 体 S， 此 结构 体 类 型 声明 了 一 个 变量 s 


struct S 


int32_t ay b; 
}s; // s 在 这 里 尚未 初始 化 


// 在 C99 之 前 ， 我们 只 能 这 么 对 s 赋 值 
s.a = 100; 
s.b = -50; 


// 或 者 是 : 
struct S tmp = { 100, -50 }; 
s = tmp; 


// 从 C99 标 准 开始 ， 对 变量 s 通 过 结构 体 复合 字面 量 进行 赋值 
// 注意 ， 这 里 不 是 对 s 的 初始 
S = (struct S){ .a = 100, .b = -50 }; 


下 


printf("s.a = %d, s.b = %d\n", a, Ss.b); 
// 一 个 结构 体 复合 字面 量 能 够 作为 一 个 变量 充当 左 值 ， 

// 从 而 可 以 对 其 内 部 变量 成 员 用 修改 操作 ， 尽管 这 通常 来 说 没有 实践 意义 
((struct S) { 10, 20 }).a += 10; 


了 Lk 


在 代码 清单 6-5 中 ,“ (struct S) {.a=100，.b=-50}; ”就 是 一 个 结 
构 体 复合 字面 量 。 其 形式 与 初始 化 非常 类 似 ， 其 实 就 是 在 初始 化 器 {} 
的 左边 加 上 对 该 结构 体 的 投射 操作 (关于 投射 操作 符 可 详细 参考 5.3.2 
节 以 及 5.6 节 的 内 容 ) 。 我 们 看 到 ， 对 结构 体 类 型 S 的 一 个 变量 s 进 行 赋 
值 时 没有 通过 一 个 临时 变量 ， 而 直接 使 用 该 复合 字面 量 进行 赋值 。 在 
代码 清单 6-5 的 最 后 也 可 以 看 到 ， 一 个 结构 体 复合 字面 量 可 以 充当 左 


值 ， 从 而 可 直接 修改 其 内 部 变量 成 员 的 值 ， 这 一 点 与 其 他 一 般 的 字面 
量 只 能 作为 常量 不 同 。 当 然 ， 对 结构 体 复 合 字面 量 直接 做 修改 操作 通 
常 没有 什么 实践 意义 ， 不 过 如 末 我 们 通过 指针 直接 指向 该 字面 量 的 
话 ， 有 了 时 也 能 方便 某 些 操 作 。 


全 ;六 。 盾 彰 初始 化 是 措 在 声明 了 一 个 对 象 之 后 ， 立 即 用 等 号 
操作 符 = 对 它 做 初始 赋值 。 如 果 在 声明 时 没有 用 等 号 操作 符 对 该 对 象 
进行 操作 ， 那 么 在 此 之 后 就 不 能 再 用 初始 化 器 对 它 进 行 初始 化 了 ， 而 
只 能 对 它 做 一 般 的 赋值 处 理 。 所 以 在 上 述 代 码 中 ， 如 果 我 们 直接 用 “s= 
{.a=100，.b=-50}; ”将 会 出 现 编译 名 报错 。 


、 
pe 


最 后 ， 关 于 匿名 结构 体 还 有 一 个 非常 有 趣 的 设 定 。 当 一 个 结构 体 
中 含有 一 个 匿名 结构 体 ， 且 没有 用 它 来 声明 一 个 成 员 对 和 象 时 ， 那 么 该 
匿名 结构 体 中 所 声明 的 对 象 成 员 可 直接 视 为 其 外 部 结构 体 成 员 那 样 被 
直接 访问 。 如 代码 请 单 6-6 所 示 。 


代码 清单 6-6 ”匿名 结构 体 的 特性 


#include <stdio.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 


// 定义 了 一 个 结构 体 S 


Struct S 
// 声明 成 员 对 象 a 
Int32 t a; 


// 定义 了 一 个 匿名 结构 体 
struct 
{ 

// 在 此 定义 了 成 员 对 象 b 和 c 


int32_t b; 
int32_t c; // 这 里 c 被 字 节 填充 ， 扩 展 了 4 字 广 
}; // 这 里 没 声明 该 匿名 结构 体 的 对 象 作 为 结构 体 S 的 成 员 


// 声明 成 员 对 象 d 


double d， 
}s; // 直接 用 结构 体 S 声 明 变量 s， 且 未 对 它 初 始 化 
s.a = 0; // 对 结构 体 变量 s 的 成 员 a 赋 值 
Sb. =: // 对 结构 体 变量 s 的 匿名 结构 体 成 员 b 赋 值 
S.C = 2; // 对 结构 体 变 量 s 的 匿名 结构 体 成 员 c 赋 值 
s.d = 10.5; // 对 结构 体 变 量 s 的 成 员 d 赋 值 


// 结构 体 S 与 以 下 结构 体 S2 的 存储 布局 完全 一 臻 


Struct S2 
Te 
int32 t a; 
int32_t b; 
int32_t c; // 这 里 c 被 字 节 填充 ， 扩 展 了 4 字 节 
double d; 
} s2; 


// 以 下 代码 分 别 用 于 获得 结构 体 各 个 成 员 的 偏 移 位 置 
printf("Offset of b1: %tdxn"，(ptrdiff t)&s.b - (ptrdiff_t)&s.a); 
printf("offset of c1: %td\n", (ptrdiff_t)&s.c - (ptrdiff_t)é&s.a); 
printf("Offset of d1: %td\n", (ptrdiff_t)&s.d - (ptrdiff_t)&s.a); 


printf("offset of b2: %td\n", (ptrdiff_t)&s2.b - (ptrdiff t)&s2.a)， 
printf("Offset of c2: %td\n", (ptrdiff_t)é&s2.c - (ptrdiff t)&s2.a); 
printf("offset of d2: %td\n", (ptrdiff_t)&s2.d - (ptrdiff t)&s2.a)， 


我 们 可 以 看 到 ， 代 码 清单 6-6 中 结构 体 对 象 s 对 成 员 a、d 的 访问 与 
其 内 部 匿名 结构 体 中 的 成 员 b 和 c 的 访问 完全 相同 。 男 外 ，C 语 言 标准 
也 明确 指出 ， 匿 名 结构 体 的 成 员 会 被 认 作 包 侣 该 匿名 结构 体 的 结构 体 
成 员 ， 所 以 存储 布局 也 会 与 没有 该 匿名 结构 体 的 结构 体 一 样 。 而 对 于 
上 述 代 码 中 的 最 后 6 行 代码 ， 则 十 用 于 测试 结构 体 变量 s 与 s2 的 存储 布 
局 的 。 这 里 率 涉 到 结构 体 字 市 填充 的 概念 ， 我 们 将 在 6.5 节 详细 介绍 。 
此 外 ， 结 构 体 类 型 不 能 用 作 投 味 操 作 所 指定 的 类 型 ， 即 不 能 将 一 个 对 
象 类 型 强制 转换 为 一 个 结构 体 类 型 ， 结 构 体 对 象 不 能 直接 使 用 关系 操 
作 符 来 比较 大 小 或 判定 是 否 相等 。 


6.3 ”联合 体 类 型 


联合 体 (union) 类 型 是 C 语 言 中 比较 特别 的 类 型 ， 在 整个 计算 机 
编程 语言 中 ， 除 了 与 C 语 言 基 本 兼容 的 C++ 和 Objective-C 文 持 外 ， 也 丈 
只 有 COBOL 文 持 这 种 类 型 了 。 联 合体 的 声明 形式 与 结构 体 类 似 ， 但 是 
与 结构 体 不 同 的 古 ， 联 合体 对 象 中 的 所 有 成 员 共 至 同一 存储 区 域 。 联 
合体 使 用 关键 字 union 来 声明 ，union 后 面 可 跟 一 个 标识 符 作为 该 联合 
体 的 名 字 ， 如 有 果 该 标识 符 缺 省 ， 那 么 称 此 联合 体 为 匿名 联合 体 。 我 们 
先 通 过 代码 清单 6-7 来 对 比 一 下 联合 体 与 结构 体 在 存储 布局 上 的 区 别 。 


代码 清单 6-7 联合 体 与 结构 体 存 储 布局 对 比 代码 


#include <stdint.h> 
int main(int argc, const char * argv[]) 


struct 
int8_t a; 
int16_t b; 
int32_t c; 
}s={0,1,2}; 
union 
int8_t a; 
int16_t b; 
int32_t c; 
Ju= {0}; 


代码 清单 6-7 中 ， 我 们 在 main 函 数 里 定义 了 一 个 匿名 结构 体 ， 并 用 
它 声 明了 对 象 s。 然后 定义 了 一 个 匿名 联合 体 ， 并 用 它 声明 了 对 和 象 u。 


对 象 s 与 对 象 u 的 存储 布局 如 图 6-1 所 示 (假定 使 用 桌面 操作 系统 与 编译 
器 、 小 端 模式 的 处 理 器 ) : 


我 们 假设 结构 体 按 照 一 般 主 流 C 语 言 编译 器 实现 方式 做 字 节 对 
齐 。 在 图 6-1 中 ， 结 构 体 对 象 s 中 的 成 员 a 是 int8_t 类 型 ， 占 用 1 个 字 市 ， 
然后 填充 1 个 字 节 ， 总 共 耗 费 2 个 字 节 的 存储 空间 ;成 员 b 所 以 从 偏 移 位 
置 2 开始 ， 它 是 int16 t 类 型 ， 占 用 2 个 字 节 ， 由 于 跟 a 共 同 构成 了 4 字 节 
块 ， 且 下 一 个 成 员 c 占 4 字 节 ， 所 以 无 需 字 市 填充 ， 成员 c 从 偏 移 位 置 4 
开始 ， 占 用 4 字 市 空间 。 所 以 ， 对 象 s 总 共 占 用 了 8 字 节 的 存储 空间 。 


的 存储 


8 二 


hi- 
> 


本 量 u 的 存储 布局 


图 6-1 ”结构 体 与 联合 体 的 存储 布局 


然后 再 看 对 象 u。 联 合体 对 象 u 的 a、b、c 三 个 成 员 都 从 偏 移 位 置 0 
开始 存放 ， 所 以 它们 完全 共 至 0 号 字 市 的 存储 空间 中 的 内 容 ， 然 后 成 员 
b 与 成 员 c 共 享 1 号 字 节 所 存储 的 内 容 ， 而 变量 c 则 目 己 独 至 2 和 3 号 字 市 
所 存储 的 内 容 。 所 以 联合 体 变量 u 总 共 只 占用 4 个 字 节 的 存储 空间 。 下 


面 我 们 通过 代码 清单 6-8 举 一 个 比较 直观 的 例子 来 验证 上 述 联合 体 变 量 
u 的 存储 布局 。 


代码 清单 6-8 ”联合 体 存 储 布局 可 视 化 代码 


#include <stdio.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 
union 
int8_t a; 
int16_t b; 


int32_t c; 
}U={ .c= Ox04030201 }; 


// 输出 : a = 0x00000001，b = 0x00000201, c = 0x04030201 
printf("a = Ox%.8x, b = Ox%.8x, Cc = Ox%.8x\Nn", Uu.a, U.b, u.c); 


代码 清单 6-8 先 对 联合 体 变 量 u 进 行 初始 化 ， 将 它 占 用 字 市 最 多 的 
成 员 c 进 行 初始 化 ， 我 们 用 比较 容易 观察 的 十 六 进 制 数 0x04030201 写 入 
到 成 员 c。 然 后 ， 我 们 观察 成 员 a、 成 员 b 和 成 员 c 的 值 。 输 出 后 我 们 发 
现成 员 a 的 值 就 是 成 员 c 的 值 的 最 低 8 位 〈 即 字 节 0) ; 成 员 b 则 是 成 员 c 
的 低 16 位 〈 即 字 节 0 和 字 节 1) 的 内 容 ; 成 员 c 则 是 初始 化 时 的 值 。 这 样 
束 与 我 们 上 面 所 拉 述 的 存储 布局 完全 吻合 了 。 


联合 体 在 构造 上 与 结构 体 类 似 ， 也 可 以 在 里 面 存放 其 他 类 型 的 对 
象 作 为 其 成 员 ， 包 括 枚 举 、 结 构 体 以 及 联合 体 对 象 。 下 面 举 一 些 定义 
联合 体 类 型 的 例子 。 


代码 清单 6-9 ”联合 体 类 型 的 定义 


// 定义 一 个 名 为 Union14 的 联合 体 
// 它 包 含 三 个 共享 的 成 员 
union Union1 


int32_t a; 
int8_t b; 


Int16 t s,; 
}; 


// 定义 一 个 名 为 Union2 的 联合 体 


static union Union2 


// 在 Union2 中 定义 一 个 匿名 结构 体 并 直接 用 它 声 明成 员 变 是 
struct { 

Int32_t a; 

int32_t b; 


喇 
a 


}s; 


// 声明 成 员 变 量 f， 并 与 共享 同一 联合 体 存储 
float f; 


3 


// 直接 用 Union2 声 明 一 个 静态 变量 un 
} un; 


enum MyEnum 


ENUM1, 
ENUM2 


}; 
union MyUnion 


// 用 MyEnum 枚 举 类 型 声明 对 象 e 作 为 MyUnion 联 合体 的 成 员 
enum MyEnum e; 


// 用 联合 体 Union2 声 明 对 象 u 作 为 MyUnion 联 合体 的 成 员 
union Union2 u; 


// 联合 体内 也 可 放置 静态 断言 


_Static assert(sizeof(un) == 8, "NG"); 


}; 


// 定义 一 个 名 为 MyStruct 的 结构 体 
struct MyStruct 


int32_t a; 


// 用 上 面 定义 的 Union2 声 明 u1 作 为 MyStruct 的 成 员 
union Union2 uli; 


// 定义 一 个 匿名 联合 体 ， 接 用 它 声 明 其 对 象 u2 作 为 MyStruct 的 成 员 
union{ 
double dd; 
float f; 
}u2; 
double dd; 


}; 


对 联合 体 对 象 的 初始 化 也 与 结构 体 类 似 ， 从 C99 标 准 起 可 使 用 指 
定 成 员 的 初始 化 器 。 不 过 对 联合 体 的 初始 化 只 能 初始 化 其 中 一 个 成 
员 ， 因 为 所 有 成 员 都 共 至 同一 存储 位 置 ， 所 以 如 果 对 多 个 成 员 指 定 初 
始 化 值 时 编译 需 可 能 会 发 出 警告 。 代 码 清单 6-10 是 对 联合 体 对 象 初始 
化 以 及 赋值 的 例子 。 


代码 清单 6-10 ”联合 体 对 象 的 初始 化 以 及 成 员 访 问 


#include <stdio.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 


// 定义 了 一 个 名 为 MyUnion 的 联合 体 


union MyUnion 


{ 
// 声明 了 成 员 a 
int32_t a; 
// 在 MyUnion 联 合体 内 定义 了 一 个 匿名 结构 体 
struct { 
int16_ t b; 


_t ci 
}s; // 直 # 仿 结 构 体 声明 对 象 s 作 为 MyUnion 的 成 员 


// 声明 了 成 员 f 

float f; 

// 这 里 直接 用 MyUnion 联 合体 类 型 声明 对 象 un， 并 直接 对 它 初始 化 
// 这 里 s .b 与 s.c 作 为 同一 结构 体 变量 s 的 成 员 ， 所 以 完全 可 行 


于 这 
}un={ .Ss.b = Ox0201, .s.c = Ox03 }, 


// 这 里 ，Apple LLVM 发 出 警告 ，.s .b 的 初始 化 器 会 覆盖 它 之 前 的 .a 的 初始 化 器 
unwarning = { .a = 100, .s.b = -100 }; 


// 在 C99 标 准 之 前 ， 常规 方法 只 外 对 联合 体 对 象 的 第 一 个 成 员 进行 初始 化 
union MyUnion un2 = { 100 }; // 即 un2.a 被 初始 化 为 100 


// 这 里 用 MyUnion 声 明了 对 象 un3， 但 未 对 它 进 行 初 始 化 
union MyUnion un3 


// 这 里 (union MyUnion){ .f = 10.5f a 可 量 
// 与 结构 体 复合 字面 量 类 似 。 联 合体 复合 字面 量 可 直接 对 一 个 联合 体 对 象 进行 赋值 
un3 = (union MyUnion){ .f = 10.5f }; 


// 我 们 对 un .ss 初始化 之 后 观察 un . a 的 值 
// 输出 : un.a = 0x00030201 
printf("un.a = Ox%.8x\n", un.a); 


// 对 un2. | ee s.b 的 值 


// 输出 : un2 


printf("un2.s.b = %d\n", un2.s.b); 


// 对 un3.f 初 始 化 之 后 ， 此 联合 体 起 始 地 址 的 数据 为 10 .5f 的 
// 规格 化 浮 点 数 的 二 进 制 表 

// 所 以 我 们 这 里 先 将 un3 a 的 地 址 转 为 浮 点 ， 然 后 再 转 整 型 来 观察 un3 .a 的 值 
// 输出 : un3.a = 10 

printf("un3.a = %d\n", (int32_t)*(float*)é&un3.a); 


代码 清单 6-10 比 较 详 细 地 介绍 了 联合 体 对 象 初始 化 、 赋 值 以 及 联 
合体 复合 字面 量 的 各 种 情况 。 此 外 ， 这 个 代码 示例 也 进一步 给 大 家 呈 
现 了 联合 体 中 所 有 成 员 共 至 存储 空间 的 这 一 特性 。 由 于 联合 体 对 其 成 
员 的 访问 形式 与 结构 体 完全 一 样 ， 因 此 这 里 不 再 次 述 。 


此 外 ， 联 合体 与 结构 体 一 样 ， 不 能 用 作 投 射 操 作答 所 指定 的 类 
型 ， 联 合体 对 象 不 能 直接 使 用 关系 操作 符 来 比较 大 小 、 判 断 是 否 相同 
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6.4 ”位 域 


位 域 (bit-fields) 也 是 C 语 言 比较 独特 的 语法 之 一 。 通 过 位 域 ， 我 
们 可 以 将 一 串 比 特 流 进行 结构 化 描述 ， 这 在 通信 和 领域 用 得 尤为 广泛 。 
在 C 语 言 中 ， 位 域 是 在 结构 体 或 联合 体 中 指定 位 蚁 的 成 员 。 通 常 我 们 
都 用 结构 体 来 指定 位 域 ， 尽 管 联合 体 也 可 以 指定 成 员 的 位 宽 ， 但 基本 
没什么 实际 意义 ， 因 为 联合 体 的 成 员 都 共 至 同一 存储 单元 。 


6.4.1 位 域 的 一 般 特 性 


如 条 结构 体 中 的 某 一 成 员 要 作为 位 域 ， 那 么 它 必 须 是 一 个 整数 类 
型 《包括 布尔 和 枚 举 类 型 ) ， 而 不 能 是 浮 点 或 其 他 类 型 。 指 定 该 位 域 
宽度 的 表达 式 也 应 该 是 一 个 整数 向量 表达 式 ， 且 表达 式 的 值 不 能 是 负 
数 。 位 域 的 基本 表达 式 为 : 


< 类 型 > < 标识 符 > : < 位 宽 表达 式 >， 


这 里 < 位 宽 表 达 式 > 束 用 于 指定 此 位 域 的 宽度 ( 即 取 值 范 围 ) ， 单 
位 是 比特 。 比 如 代码 清单 6-11 所 示 。 


代码 清单 6-11 ”结构 体位 域 的 简单 介绍 


struct BitField 
{ 


int32 t a : 5; // a 由 5 个 比特 构成 ， 取 值 范 围 在 [-16，15] 
uint32 t b : 6; // b 由 6 个 比特 构成 ， 取 值 范围 在 [0， 63] 
int32 t c :7; // Cc 由 7 个 比特 构成 ， 取 值 范围 在 [-64，63] 


}; 


代码 清单 6-11 中 ，BitField 的 成 员 a、b 和 c 都 是 位 域 。 其 中 ，a 的 宽 
度 为 5 个 比特 ， 由 于 它 是 带 符号 整数 ， 因 此 这 5 个 比特 中 最 高 位 需要 作 
为 符号 位 ， 因 此 其 取 值 范围 在 [-24，24-1]。 成 员 b 的 宽度 为 6 个 比特 ， 

由 于 它 是 一 个 无 符号 整 型 ， 因 此 其 取 值 范围 在 [0，26-1]。 整 个 BitField 
类 型 大 小 为 4 个 字 节 。 由 于 a、b、c 这 3 个 成 员 的 宽度 加 起 来 为 18 个 比 
特 ， 少 于 32 比 特 ， 一 般 C 语 言 实现 会 将 其 扩充 到 4 个 字 节 (正好 是 一 个 


int32_t 类 型 的 宽度 ) 。 


C 语 言 对 位 域 还 有 以 下 限制 : 


1) 不 能 对 位 域 成 员 做 取 地 址 操作 ，; 


2) 位 域 成 员 不 能 作为 sizeof 的 操作 数 ，; 


3) 不 能 用 对 齐 属性 来 修饰 位 域 ; 


4) 指定 位 域 位 宽 的 和 常量 值 不 能 超过 该 类 型 可 表示 的 范围 。 


代码 清单 6-12 展 示 了 对 位 域 的 一 些 错误 的 用 法 。 


代码 清单 6-12 ”位 域 的 一 坚 错 误 用 法 


#include <stdio.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 


{ 
struct BitField 
_Alignas(int32_t) int32_t a : 5; // 这 人 句 报 错 ! _Alignas 属 性 不 能 用 于 位 域 
uint32 t b : 6; 有， 
char c : 9; // 这 人 句 报 错 ! 一 个 char 类 型 对 象 最 多 只 能 由 8 个 比特 构成 
}bf = { 10, 20 } 
int32_t *p = &bf.a; // 这 句 报错 ! 不 能 对 位 域 做 取 地 址 操作 
size_t size = sizeof(bf.b); // 这 句 报错 ! sizeof 操 作 符 不 能 用 于 位 域 
} 


上 面 讲述 了 位 域 的 形式 以 及 约束 。 下 面 我 们 将 描述 位 域 的 二 进 制 
表达 方式 ， 请 见 代码 清单 6-13。 


代码 清单 6-13 ”结构 体 中 位 域 的 二 进 制 表达 形式 


#include <stdio.h> 
#include <stdbool.h> 


int main(int argc, const char * argv[]) 


{ 

enum MyEnum 
ENUM1， 
ENUM2 ， 
ENUM3 

}; 

struct MyStruct 
int32 t a :; 6; // a 的 范围 为 [-32，31] 
int16 t b : 5; // b 的 范围 为 [-16，15] 
int8 t c : 8; // c 的 范围 为 [-128，127] 
char x : sizeof(enum MyEnum); // 相当 于 : char x : 4 
bool y : 1; 
enum MyEnum e : ENUM3; // 相当 于 : enum MyEnum e : 2 


}s = { 9090x18，0xoa，0x77，'\90'，true，ENUM3 }; 


// s 的 二 进 制 表 示 : (0) 10 1 0000 01110111 (00000) 01010 011000 
// 整理 后 得 : 9101 0000 0111 0111 0006 0010 1001 1000 
printf("The size is: %zu\n", sizeof(s)); 


// 输出 9x50779298 
printf("The content of s is: 0x%.8XxNn"，*(Uint32_t*)&s) ， 


代码 清单 6-13 中 ， 我 们 在 main 范 数 里 定义 了 一 个 名 为 MyStruct 的 
结构 体 类 型 ， 其 中 的 成 员 均 为 位 域 。 我 们 看 到 ， 位 域 成 员 的 类 型 可 以 
征 各 类 整数 类 型 、 字 符 类 型 、 布 尔 类 型 以 及 枚 举 类 型 。 而 指定 位 域 宽 
度 的 整数 第 量 表达 式 可 以 是 整数 字面 量 、sizeof 操 作 符 所 得 到 的 结 采 、 
枚 举 值 等 ， 它 们 必须 是 在 编译 时 能 确定 值 的 常量 。 


6.4.2 ”位 域 成 员 的 存放 与 布局 


代码 清单 6-13 中 ， 我 们 分 别 对 MyStruct 结 构 体 对 象 的 每 个 成 员 进 
行 初始 化 ， 得 到 s 内 部 表示 的 二 进 制 如 注释 中 所 示 。MyStruct 结 构 体 类 
型 大 小 为 4 个 字 市 ， 而 s 的 二 进 制 表 示 中 ， 用 加 括号 括 起 来 的 二 进 制 比 
符 表 示 是 被 填充 的 比特 ， 其 他 比特 表示 每 个 成 员 本 喘 的 值 。 其 中 ， 成 
员 a 古 最 右边 的 6 个 比特 ， 然 后 之 后 的 每 个 位 域 成 员 都 依次 从 右 癌 左 排 
列 。 比 特 填 充 对 于 不 同 编译 事 、 不 同 执行 环境 可 能 会 不 同 。 不 过 C 语 
言 标准 指明 的 是 ， 对 于 同一 结构 体内 毗邻 两 个 位 域 成 员 ， 如 采 人 第 一 个 
位 域 成 员 仍然 有 足够 的 存储 空间 容纳 第 二 个 位 域 成 员 ， 那 么 第 二 个 位 
域 成 员 可 以 与 前 一 个 位 域 成 员 打 包 在 一 起 ， 一 起 构成 同一 单元 的 毗邻 
比特 串 ， 这 个 可 以 参考 代码 清单 6-13 中 的 成 员 a 与 b。 成 员 a 的 类 型 为 
int32 t， 位 宽 为 6 个 比特 ;成 员 b 的 类 型 为 int16 t， 位 宽 为 5 个 比特 ， 它 
与 成 员 a 正 好 可 以 组 合 在 一 起 ， 构 成 11 个 比特 的 串 ， 存 放 在 同一 单元 。 


如 果 构 成 一 个 单元 的 存储 空间 不 够 ， 那 么 后 一 个 位 域 是 被 放 在 下 
一 个 存储 单元 还 是 与 之 前 的 单元 迭 交 存放 ， 这 是 由 实现 自己 定义 的 。 
在 一 个 单元 内 的 位 域 分 配 次 序 (从 高 位 序 到 低位 序 还 是 从 低位 序 到 高 
位 序 ) 也 是 由 实现 自己 定义 的 。 此 外 ， 可 寻 址 存储 单元 如 何 做 字 节 对 
齐 在 标准 中 也 是 未 指定 的 。 在 代码 清单 6-13 中 ， 我 们 看 到 成 员 c 占 8 个 
比特 ， 如 果 将 它 与 之 前 a 和 b 构 成 的 11 比 特 串 拼接 在 一 起 ， 那 么 它 超 出 
了 之 前 a 和 b 所 在 的 16 比 特 可 寻 址 存储 单元 。 因 此 ， 在 Apple LLVM 的 实 
现 中 ， 它 采用 的 是 将 成 员 c 放 在 下 一 个 可 寻 址 存储 单元 内 ， 所 以 成 员 a 
和 b 所 在 的 单元 最 后 高 5 位 用 0 填充 ， 直 到 正好 满 16 比 特 。 倘 若 成 员 c 的 
位 宽 为 5 个 比特 ， 那 么 成 员 c 就 能 与 a 和 b 拼 接 在 一 起 ， 存 放 在 同一 可 寻 
址 存储 单元 ， 如 代码 清单 6-14 所 示 。 此 外 ， 对 于 现在 桌面 操作 系统 以 
及 当前 主流 C 编 译 器 而 言 ， 在 同一 可 寻 址 存储 单元 中 采用 从 低位 序 到 
高 位 序 的 排列 方式 。 


代码 清单 6-14 成员 c 与 成 员 a 和 b 一 起 拼接 的 结构 体 


#include <stdio.h> 
#include <stdbool.h> 


int main(int argc, const char * argv[]) 
enum MyEnum 
ENUM1, 


ENUM2 ， 
ENUM3 


struct MyStruct 


int32 t a : 6; // a 的 范围 为 [-32，31] 
int16 t b : 5; // b 的 范围 为 [-16， 15] 
int8 t c : 5,; // c 的 范围 为 [-16， 15] 


char x : sizeof(enum MyEnum);  // 相当 于 : char x : 4 


bool y : 1; 


enum MyEnum e : ENUM3,; // 相当 于 : enum MyEnum e : 2 


}s = { 9090x18，0xoa，0x07，'\6'，true，ENUM3 }; 


// s 的 二 进 制 表 示 : (000000000) 10 1 0110 00111 01010 011000 
// 整理 后 得 : 9000 0000 0101 0110 0011 1010 1001 1000 
printf("The size is: %zu\n", sizeof(s)); 


// 输出 0x90563a98 
printf("The content of s is: Ox%.8x\n", *(Uuint32_t*)&s); 


我 们 上 面 提 到 几 个 邻近 的 位 域 成 员 可 以 说 拼接 到 同一 个 可 寻 址 存 
储 单 元 ， 那 么 我 们 会 有 疑问 ， 如 何 确 定 这 一 可 寻 址 存储 单元 的 大 小 
呢 ? 一 般 C 语 言 实现 可 以 先 将 第 一 个 和 第 二 个 位 域 成 员 先 拼接 在 一 
起 ， 如 采 能 成 功 拼 授 ， 那 么 观察 它们 已 占用 的 比特 个 数 ， 向 上 取 满 足 
2° 的 最 小 整数 。 比 如 代码 清单 6-13 中 ， 成 员 a 和 先 与 成 员 b 拼 接 ， 由 于 
拼接 后 ， 没 有 超出 它们 俩 任 一 类 型 的 最 大 宽度 范围 ， 所 以 可 以 拼接 在 
一 起 ， 这 样 束 形成 了 一 个 11 个 比特 的 串 ， 占 用 了 两 个 字 节 的 存储 单 
元 。 然 后 到 了 成 员 c， 在 代码 清单 6-13 中 ，c 的 位 宽 为 8 个 比特 ， 倘 若 与 
a 和 b 拼 接 在 一 起 ， 那 么 就 超过 双 字 节 的 存储 单元 ， 此 时 C 语 言 标准 允 
许 C 语 言 实现 做 一 个 选择 ， 让 成 员 c 放 在 下 一 个 存储 单元 ， 或 是 让 它 与 
a 和 b 也 拼接 在 一 起 ， 那 么 c 就 横 跨 了 两 个 存储 单元 〈 也 就 是 标准 所 提 到 
的 琶 交 存放 的 情况 ) ， 而 Apple LLVM 选 择 了 前 者 ， 即 让 成 员 c 存 放 在 
下 一 个 单元 。 在 代码 清单 6-14 中 ， 由 于 成 员 c 占 5 个 比特 ， 与 a 和 b 已 经 
串 好 的 11 比 特 拼接 在 一 起 后 ， 形 成 16 比 特 串 ， 正 好 能 存放 在 当前 存储 
单元 。 因 此 在 代码 清单 6-14 中 ，a、b 和 c 都 在 同一 可 寻 址 存储 单元 。 


最 后 ， 为 了 主 各 位 对 可 寻 址 存储 单元 大 小 的 分 配 能 有 进一步 的 认 
识 ， 我 们 对 代码 清单 6-13 再 做 一 些小 修改 〈 见 代码 清单 6-15) ， 然 后 
看 看 结 


代码 清单 6-15 ”将 成 员 b 和 c 均 改 为 int 类 型 


#include <stdio.h> 
#include <stdbool.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 
enum MyEnum 
ENUM1, 


ENUM2 ， 
ENUM3 


}; 
struct MyStruct 
{ 


int32 ta : 6; // a 的 范围 为 [-32，31] 
int32 t b : 5; // b 的 范围 为 [-16， 15] 
int32 tc : 8; // c 的 范围 为 [-128，127] 


char x : Sizeof(enum MyEnum); 
bool y : 1; 


enum MyEnum e : ENUM3， 


}s = { Ox1i8, Ox0a, Ox77, '\1', true, ENUM3 }; 


// s 的 二 进 制 表示 : (000000) 10 1 0001 01110111 01010 011000 
// 整理 后 得 : 9000 0010 1000 1011 1011 1010 1001 1000 
printf("The size is: %zuxn"，Sizeof(S))， 


// 输出 9x928bba98 
printf("The content of s is: 0x%.8XxNXn"，*(Uint32_t*)&s) ， 


代码 请 单 6-15 中 ， 我 们 将 成 员 b 与 成 员 c 类 型 晋升 到 int32_t 之 后 ， 
它们 所 存放 的 可 寻 址 存储 单元 束 有 32 个 比特 之 多 。 此 时 ， 我 们 可 以 看 
到 这 样 束 能 将 此 结构 体 剩 余 位 域 成 员 全 都 闭 入 其 中 ， 所 以 比特 填充 只 


6.4.3 ”匿名 位 域 


在 C11 标 准 中 ， 位 域 可 以 古 匿名 的 。 当 某 个 位 域 只 给 出 其 类 型 及 
宽度 ， 而 不 给 出 标识 符 名 时 ， 该 位 域 则 称 为 匿名 位 域 。 匿 名 位 域 一 般 
仅 用 作 比 特 填 充 《通常 C 语 言 的 实现 都 用 0 来 填充 ) ， 而 不 能 被 直接 访 
问 该 填充 区 域 。 而 当 匿 名 位 域 的 宽度 为 0 时 ， 则 表示 该 位 域 是 其 前 面 的 
位 域 所 组 成 的 存储 区 域 的 末尾 ， 即 作为 一 个 结束 标志 而 使 用 。 该 存储 
区 域 的 后 续 比 特 都 将 被 填充 ， 其 下 面 的 位 域 都 将 作为 一 个 新 的 存储 区 
域 。 下 面 我 们 将 举 一 个 使 用 匿名 位 域 的 例 于 ， 见 代码 清单 6-16。 


代码 请 单 6-16 匿名 位 域 使 用 示例 


#include <stdio.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 


struct 
int32 ta :; 8; 
// 这 里 使 用 了 一 个 匿名 位 域 ， 使 得 位 域 a 与 位 域 b 之 间 空 出 8 比特 ， 
// 这 空 出 的 8 比特 均 用 0 来 填充 
int32 _t: 8; 
int32 t b : 16; 


这 里 分 别 给 成 员 a 和 b 进 行 初始 化 
， 对 象 s 仍 然 具 有 两 个 成 员 (a 和 b) ， 中 间 填 充 部 分 无 法 访问 
}s = { Ox21, Ox6543 }; 


// 这 里 输出 : s is: 0x65430021 
printf("s is: Ox%.8X\n", *(uint32 t*)&s); 


struct 


int32 t a : 


// 这 晶 使 用 了 一 个 匿名 位 域 ， 且 宽度 为 @， | 
// 这 样 位 a 所 在 的 整个 区 域 后 续 都 将 被 06 填充， 然后 终结 该 区 域 
int32 t : 0; 


// 位 域 b 将 被 安排 在 位 域 a 的 下 一 个 存储 区 域 ， 而 不 会 跟 a 存 放 在 同一 区 域 
int32 t b : 16; 


| 


// 下 面 的 x 与 y 都 会 与 位 域 b 存 放 在 同一 存储 区 域 
int16 t x : 8; 


Int16 ty : 8; 


// 这 里 分 别 给 成 员 a，b，x， 和 y 进 行 初始 化 
}t = { Ox10, QOx4321, Ox65, QOx76 }; 


// 这 里 输出 : t is: 0x7665432100000010 
printf("t is: Ox%.16]lX\n", *(uint64 t*)e&t); 


6.4.4 ”位 域 使 用 示例 


在 实践 中 ， 我 们 往往 把 需要 拼接 在 一 起 的 位 域 成 员 用 相同 类 型 或 
相同 字 市 宽度 的 类 型 毗邻 排放 ， 这 样 可 以 避免 一 些 不 必要 的 比特 填 
充 ， 从 而 能 够 获得 更 好 的 位 域 结构 化 描述 。 我 们 下 面 举 一 个 天 于 初中 
学 生 信息 部 分 属性 的 例子 来 描述 位 域 在 实践 中 的 使 用 方式 ， 如 代码 清 
单 6-17 所 示 。 


代码 清单 6-17 位 域 在 实践 中 的 使 用 


#include <stdio.h> 

#include <stdbool.h> 

#include <stdint.h> 

int main(int argc, const char * argv[]) 


struct Student 


uint32_t grade : 2; // 年 级 (1-3， 对 于 初中 生 可 用 0 表示 预备 班 ) 
uint32_t class : 4; // 班级 ， 一 个 年 级 最 多 可 有 16 个 班级 
uint32_t number : 7; // 学 号 ， 一 个 班级 最 多 128 个 学 生 
uint32_t weight : 7; // 体重 ,一 个 学 生 最 重 128kg 

uint32_t height : 8; // 身高 ,一 个 学 生 最 高 256cm 

uint32_t isMale : 1; // true 表 示 男 生 ; false 表 示 女 生 
uint32_t age : 3 // 年 龄 (10 到 17 岁 ) 


}; 


// 声明 了 一 个 学 生 对 象 ，1 年 级 5 班 ，26 号 ，50kg，160cm， 男 生 ，14 岁 
struct Student s = { 1, 5, 26, 50, 160, true }; 


printf("size is:%zu\n", sizeof(Ss)); 


代码 清单 6-17 中 我 们 定义 了 名 为 Student 的 一 个 结构 体 ， 整 个 结构 
体 的 大 小 为 4 个 字 闻 ， 而 就 这 4 个 字 节 我 们 就 定义 了 一 个 学 生 的 7 个 属 
性 。 由 于 在 这 个 学 生 的 结构 体 中 很 多 属性 不 需要 一 个 字 节 (8 比特 ) 来 
表示 ， 而 只 要 很 少儿 个 比特 就 能 表示 其 范围 了。 比如 第 一 个 属性 “年 
级 ”， 一 所 中 学 的 年 级 一 般 为 1 到 3 年 级 ， 所 以 我 们 用 2 个 比特 就 能 表示 
这 个 范围 ，2 比 特 的 无 符号 整数 可 表示 的 范围 是 [0，3]。 这 里 ， 对 一 个 
学 生 对 象 s 初 始 化 的 各 个 属性 为 : 1 年 级 ，5 班 ， 学 号 为 26 号 ， 体 重 
50kg， 身 高 160cm， 男 生 ，14 岁 。 我 们 可 以 看 到 ， 通 过 位 域 可 以 将 信 
息 做 些 压缩 ， 使 得 数据 对 象 信息 尽 可 能 少 地 占用 存储 空间 。 如 果 以 上 
这 些 属性 都 要 用 8 位 无 符号 整数 来 表示 〈 比 如 像 Java 语 言 就 不 文 持 位 
域 ) ， 那 么 就 至 少 需要 7 个 字 节 。 


在 前 几 玫 我 们 已 经 所 到 了 一 些 天 于 字 世 对 齐 与 字 世 填充 的 使 用 场 
景 ， 本 万 将 详细 摘 述 C 语 言 中 的 字 世 对 齐 与 字 有 填充 。 


在 2.5 世 中 ， 我 们 已 经 大 致 描述 了 字 节 对 齐 这 个 概念 ， 并 解释 了 为 
何 计算 机 系统 需要 字 节 对 齐 。 由 于 C 语 言 是 非常 贴近 底层 硬件 的 高 级 编 
程 语言 ， 所 以 它 本 里 就 含有 诸多 字 廊 对 齐 的 语法 特性 。 然 而 字 太 对 齐 
对 于 不 同 架 构 的 处 理 絮 可 能 会 有 不 同 要 求 。 对 于 一 般 32/64 位 系统 环 
境 ， 通 第 编译 絮 会 默认 对 指令 与 数据 做 4 子 市 对 齐 。 也 就 是 说 ， 一 个 函 
数 的 起 始 地 址 以 及 一 个 数据 对 象 的 起 始 地 址 都 会 是 4 字 世 的 倍数 (比如 
地 址 0x01001000，0x00400204 等 ) 。 而 像 在 ARM 处 理 絮 架构 下 ， 每 条 
ARM 指 令 所 在 的 地 址 都 必须 是 4 字 节 对齐 〈 即 4 字 节 的 倍数 ) ， 否 则 执 
行 指令 时 就 会 引发 异常 ， 而 在 AArch32 环 境 下 ， 对 每 个 函数 的 栈 起 始 地 
址 要 求 是 8 字 节 对 齐 ( 即 8 字 节 的 倍数 ) ， 由 于 这 样 能 优化 LDP 指 令 

(用 于 一 下 子 读 取 两 个 连续 的 4 字 节 字 的 操作 ) 对 数据 的 读 取 ; 而 在 
AArch64 环 境 下 ， 则 要 求 每 个 函数 的 栈 的 起 始 地 址 应 该 为 16 字 节 对 齐 。 


6.5.1 _Alignof 操 作 符 


在 C 语 言 中 ， 每 个 完整 的 对 象 类 型 都 具有 对 齐 要 求 。 所 谓 N 字 节 对 
齐 是 指 分 配 该 对 象 存储 空间 时 ， 其 起 始 地 址 必须 是 N 字 下 的 倍数 。 比 
如 ， 一 个 对 象 要 求 4 字 市 对 齐 则 意味 着 给 该 对 象 分 配 的 起 始 地 址 必须 能 
家 4 整除 。 尽 管 每 个 C 编 译 右 的 实现 对 于 对 齐 要 求 可 能 有 些 不 同 ， 不 过 


在 传统 的 桌面 环境 中 ， 一 般 基 本 数据 类 型 的 对 齐 参照 其 数据 类 型 本 身 
的 大 小 。 比 如 ， 一 个 char 类 型 的 对 并 要 求 为 1 个 字 证 ， 一 个 short 类 型 的 
对 齐 要 求 为 2 个 字 市 ， 一 个 int 类 型 的 对 齐 要 求 为 4 个 字 玉 ， 等 等 。C11 标 


准 引 入 了 _Alignof 关 键 字 来 查看 当前 指定 对 象 的 对 齐 要 求 。 


_Alignof 的 用 法 与 sizeof 类 似 ， 但 有 两 点 不 同 : 


1) sizeof 后 面 可 直接 跟 一 个 对 象 标识 符 而 不 需要 圆 括号 ， 但 
_Alignof 则 不 行 。_Alignof 后 面 必 须 跟 着 一 对 圆 括号 ， 然 后 在 圆 括号 里 
存放 操作 数 。 


2) _Alignof 的 操作 数 只 能 是 类 型 名 (基本 类 型 、 枚 举 类 型 、 结 构 
体 、 联 合体 等 ) ， 而 不 能 是 一 个 表达 式 (包括 对 象 标识 符 都 不 行 )。 
不 过 GNU 语 法 扩展 能 使 得 _Alignof 的 操作 数 为 表达 式 ， 这 样 我 们 在 
GCC、Clang 编 译 故 中 束 能 使 用 此 特性 。 


此 外 ，_Alignof 同 样 也 返回 一 个 size_t 类 型 的 值 表 示 指 定 类 型 的 对 
齐 要 求 。 


顺应 C11 标 准 的 实现 都 应 该 含有 一 个 max_align_t 类 型 ， 表 示 当 前 实 
现 对 基本 对 齐 要 求 的 最 大 对 齐 的 支持 。 如 果 某 个 C 语 言 实现 无 法 直接 使 
用 max_align_ {t， 那 么 可 以 通过 包含 <stddef.h> 头 文件 来 解决 。 所 谓 基本 
对 齐 要 求 是 指 C 语 言 编 译 器 在 没有 受到 程序 员 指 定 的 情况 下 自己 做 出 的 
默认 对 齐 要 求 。 比 如 上 面 提 到 的 char、short、int 类 型 的 默认 对 齐 要 求 。 
而 对 于 一 个 数组 或 一 个 结构 体 ， 如 果 它 们 的 存储 空间 非常 大 ， 此 时 编 
译 器 将 会 按照 _Alignof (max_align_t) 字 节 对 齐 要 求 对 它们 做 对 齐 。 
max_align_t 这 个 类 型 也 是 编译 器 自己 实现 的 ， 像 Apple LLVM 编 译 器 是 
将 它 定 义 为 long double 类 型 (大 小 为 16 字 节 ) ; 在 GCC、MSVC 与 VS- 
Clang 中 被 定义 为 double 类 型 (大 小 为 8 字 节 ) 。 此 外 ， 我 们 在 查询 对 齐 
要 求 的 时 候 可 以 引入 标准 头 文 件 <stdalign.h>， 这 里 面 会 有 对 _Alignof 所 
定义 的 宏一 一 alignof。alignof 是 用 在 C++ 中 的 关键 字 ， 其 作用 与 C 语 言 
的 _Alignof 一 样 。 下 面 我 们 通过 代码 清单 6-18 来 看 看 _Alignof 的 具体 使 
用 方式 。 


代码 清单 6-18 ”_Alignof 的 使 用 


#include <stdio.h> 
#include <stdbool.h> 
#include <stdalign.h> 
#include <stddef.h> 


int main(int argc, const char * argv[]) 


// 这 里 查询 当前 编译 器 的 最 大 对 齐 字 节 数 
size_t size = _Alignof(max_align_t); 


printf("Max alignment is:%zu\n", size); 


// 这 里 查询 布尔 类 型 的 对 齐 字 节 数 

// 我 们 引入 了 <stdalign.h> 头 文件 后 可 直接 使 用 alignof 
size = alignof(bool)， 

printf("Boolean alignment is: %zu\n", size); 


// 定义 一 个 结构 体 $， 然 后 声明 一 个 变量 s 并 对 它 初 始 化 
struct S 


int a; 
float f; 
double d; 
long double 1d; 
}s = { 90, 1.0f, 10.5, 1000.0005L }; 


// 在 C11 标 准 中 ，alignof 操 作 数 必须 是 一 个 类 型 名 ， 不 能 是 一 个 表达 式 
// 所 以 这 里 只 用 alignof(struct S)， 而 不 能 用 alignof(s) 

size = alignof (struct Ss); 

printf("S alignment is: %zu\n", size); 


RE 


np 
CC 


6.5.2 _Alignas 对 齐 说 明 符 


。 


6.5.1 玫 介绍 的 是 类 型 默认 对 齐 以 及 _Alignof 操 作 符 的 使 用 。 但 在 很 
多 情况 下 ， 通 过 编译 僻 的 默认 对 章 方式 无 法 满足 对 齐 要 求 ， 尤 其 涉及 
高 性 能 计算 领域 时 ， 我 们 可 能 要 将 一 个 结构 体 或 一 个 数组 以 16 字 市 对 
齐 甚至 64 子 市 对 章 的 方式 存放 。 


C11 标 准 引 入 了 对 齐 说 明 符 一 一 _Alignas 操 作 符 ， 用 于 显 式 指定 某 
个 对 象 以 多 少 字 节 对 齐 。_Alignas 操 作 符 的 用 法 与 _Alignof 类 似 ， 不 过 
_Alignas 的 操作 数 可 以 是 一 个 常量 表达 式 。 该 常量 表达 式 用 于 显 式 指明 
当前 指定 对 象 以 多 少 字 节 对 齐 。 男 外 与 _Alignof 类 似 的 是 ， 当 我 们 引入 
<stdalign.h> 头 文件 后 ， 我 们 可 直接 使 用 alignas 来 代替 _Alignas 。 


一 般 C11 标 准 的 实现 对 _Alignas 操 作 数 也 有 一 些 约束 和 限制 : 


1) _Alignas 操 作 数 所 指定 的 字 节 对 齐 大 小 不 能 小 于 当前 C 语 言 实现 
默认 的 对 齐 大 小 。 比 如 ， 一 个 int 对 和 象 的 默认 对 齐 大 小 如 果 是 4 字 市 ， 那 


么 当 我 们 使 用 _Alignas (1) int a; 来 声明 对 象 a 的 时 候 ， 编 译 器 可 能 会 
报错 。 


2) _Alignas 的 操作 数 应 该 是 0、1、2、4 等 无 符号 整数 。 当 其 操作 
数 大 于 4 时 ， 该 操作 数 必须 是 4 的 倍数 ， 否 则 编译 磺 可 能 报错 。 比 如 ， 
Alignas (5) ，_Alignas (10) 均 可 能 是 无 效 的 对 齐 说 明 符 。 当 
_Alignas 的 操作 数 为 0 时 ， 表 示 和 忽略 此 对 齐 说 明 符 ， 此 时 编译 器 将 会 以 
默认 方式 对 指定 对 象 采 取 字 节 对 齐 要 求 。 


3) 编译 器 实现 一 般 都 会 对 对 齐 说 明 符 指定 一 个 最 大 可 对 齐 的 字 节 
数 ， 在 Apple LLVM 编 译 器 中 指定 为 256MB， 如 果 _Alignas 的 操作 数 的 
值 超过 256x1024x1024， 那 么 编译 器 将 会 报错 。 


此 外 ， 在 一 个 对 象 声 明 符 中 ， 可 多 次 使 用 对 齐 说 明 符 ， 如 有 果 在 一 
条 声明 语句 中 存在 多 个 对 齐 说 明 符 ， 则 声明 的 对 象 将 按照 最 大 指定 的 
对 齐 字 下 数 来 对 齐 。 

下 面 ， 我 们 将 通过 代码 清单 6-19 来 描述 对 齐 说 明 符 的 用 法 以 及 效 
果 。 为 了 观察 实际 使 用 对 齐 说 明 符 后 的 效果 ， 我 们 需要 动用 GNU 语 法 
扩展 ， 所 以 清单 6-19 中 的 代码 大 家 需要 在 GCC 或 Clang 编 译 器 中 壬 试 。 

代码 清单 6-19 _Alignas 操 作 符 的 使 用 及 效果 


#include <stdio.h> 
#include <stdbool.h> 
#include <stdalign.h> 


int main(int argc，const char * argv[]) 


{ 
// 这 里 声明 了 int 类 型 对 象 a1， 并 观察 其 默认 的 对 齐 字 节 数 
int al = 0; 
size_t align = alignof(a1); 
printf("a1i alignment is: %zu\n", align); 
// 用 double 对 齐 属 性 来 给 int 类 型 对 象 a2 做 字 节 对 齐 
// Alignas 对 齐 说 明 符 可 以 放 在 类 型 后 面 ， 对 象 标 ; 只 符 前 本 
int _Alignas(double) a2 = 0; 
align = alignof(a2); 
printf("a2 alignment is: %zu\n", align); 
// int 类 型 对 象 a3 的 对 齐 有 些 复杂 ， 
// 它 是 从 int、double 以 及 指定 的 64 字 节 对 齐 这 三 种 对 齐 方 式 中 ， 
// 选 出 最 大 对 齐 字 节 数 的 那个 作为 对 齐 要 求 
alignas(int) alignas(double) alignas(64) int a3 = 0; 
align = alignof(a3); 
printf("a3 alignment is: %zu\n", align); 
// 这 里 ， 对 对 象 d 采 用 指定 为 9 的 对 齐 ， 那 么 它 仍然 用 默认 的 对 齐 方 式 
double alignas(0) d = 0; 
align = alignof(d); 
printf("d alignment is: %zu\n", align); 
// 这 里 演示 了 当 我 们 吃 不 准 当前 环境 某 一 类 型 对 象 的 基本 对 齐 要 求 时 
// 我 们 可 以 使 用 条 件 表达 式 来 判断 我 们 要 求 的 对 齐 字 节 数 是 否 小 于 基 本 对 齐 要 求 ， 
// 我 们 选取 自己 要 求 的 对 齐 字 节 数 与 基本 对 齐 要 求 字 下 数 之 间 的 最 大 值 
long long alignas(alignof(long long) > 8 ? alignof(long long) : 8) 
11 = QLL; 
align = alignof(11); 
printf("11 alignment is: %zu\n", align); 
// 对 齐 说 明 符 也 能 修饰 一 个 结构 体 成 员 
struct 
// 这 里 ， 成 员 对 象 a 以 16 字 节 对 齐 
int alignas(16) a; 
int b; 
}s = {0, 0}; 
printf("s size is: %zu\n", sizeof(s)); 
printf("s alignment is: %zu\n", alignof(s)); 
// 这 条 声明 语句 是 错误 的 。 
// 因为 一 般 桌 面 环境 中 ，int 类 型 的 基本 对 齐 要 求 字 节 数 为 4 字 节 ， 
// 而 这 里 指定 的 字 节 对 齐 要 求 为 1 个 字 节 ， 小 于 4 字 节 的 基本 对 齐 要 求 
int alignas(char) err = 0; 
} 


代码 清单 6-19 展 示 了 _Alignas 操 作 符 的 知 干 种 用 法 。 包 丘 显 式 指定 
对 齐 大 小 与 默认 对 齐 大 小 的 区 别 ， 由 _Alignas 引 出 的 对 齐 说 明 符 放置 的 
位 置 〈 可 在 类 型 名 之 后 ， 但 必须 在 对 象 标识 符 之 前 ) ， 在 一 条 声明 语 
句 中 同时 存在 多 个 对 齐 说 明 符 的 情况 ， 以 及 _Alignas 操 作 数 使 用 利 量 
达 式 的 情况 。 


通过 以 上 两 个 例子 ， 我 们 应 该 能 够 基本 和 擎 握 在 C11 标 准 中 如 何 碍 询 
某 个 类 型 的 对 齐 字 节 数 以 及 如 何 自 己 指定 某 个 对 象 的 对 齐 字 廊 数 。 


6.5.3 ”结构 体 成 员 的 子 节 对 齐 与 子 太 填充 


下 面 我 们 将 介绍 结构 体 成 员 的 字 市 对 齐 以 及 字 市 填充 。C 语 言 中 ， 
结构 体 的 字 节 填充 一 般 也 是 根据 其 成 员 的 对 齐 情况 来 确定 的 。C11 标 准 
只 是 提 到 了 一 个 结构 体 或 联合 体 对 象 的 每 个 非 位 域 成 员 ， 以 实现 定义 
的 、 适 合 该 成 员 对 象 类 型 的 方式 进行 对 齐 ; 在 一 个 结构 体 或 联合 体 的 
末尾 可 以 做 字 市 填充 。 因 此， 结构 体 成 员 的 子 市 对 齐 以 及 子 广 填充 也 
主要 根据 C 编 译作 自身 的 实现 而 定 。 对 于 当前 桌面 系统 上 的 主流 C 语 言 
编译 铸 而 言 ， 主 要 遵守 以 下 规则 来 判定 每 个 成 员 的 字 世 对 齐 与 填充 : 


As 


1) 结构 体 第 一 个 成 员 所 在 的 偏 移 地 址 为 0 ( 即 从 0 开始 计 ) 。 


St 


2) 每 个 成 员 根 据 其 类 型 或 程序 员 指 定 的 对 齐 字 市 数 来 判定 它 所 在 
的 偏 移 地 址 。 如 果 该 成 员 要 求 4 字 方 对齐， 那么 它 所 处 的 偏 移 地 址 就 应 
该 征 4 的 倍数 ， 如 采 不 是 4 的 倍数 ， 则 同上 取 不 小 于 当前 侦 移 值 的 4 的 倍 


数 的 最 小 整数 。 


3) 确定 了 当前 成 员 对 象 的 偏 移 地 址 之 后 ， 它 的 起 始 地 址 到 前 一 个 
对 象 之 间 空 日 的 存储 空间 用 0 来 填充 。 


4) 结构 体 对 象 的 字 节 对 齐 要 求 与 其 成 员 中 最 大 字 市 对 齐 要 求 相 一 
2 


代码 清单 6-20 给 出 了 C 编 译 器 默认 对 齐 情况 的 结构 体 成 员 字 节 对 齐 
与 填充 。 


代码 清单 6-20 ”默认 对 齐 的 结构 体 成 员 字 下 对齐 与 填充 


#include <stdio.h> 
#include <stdalign.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 


struct 

{ 
int8_t c; 
int32_t 工 
int16_t s; 
int64 t d 


和 / 
}s = { Ox10, Ox20, QOx30, Ox40 }; 


printf("s alignment: %zu\n", alignof(s)); 
printf("size is: %zu\n", sizeof(s)); 


代码 清单 6-20 中 声明 了 一 个 匿名 结构 体 对 象 ;， 其 成 员 有 c、i、s 和 
d* 这 里 ,成 员 c 以 1 个 字 丰 对 了 ;> 成员 i 个 对 四 对 谨 成 员 5 以 2 个 地 
节 对 齐 ; 成 员 d 以 8 个 字 厄 对 齐 。 根 据 规则 4， 该 结构 体 对 象 s 是 以 8 字 市 
对 齐 的 〈 即 对 齐 要 求 与 其 成 员 d 一 致 ) ;而 s 的 大 小 为 24 个 字 节 。 


我 们 下 面 来 分 析 一 下 代码 清单 6-20 中 匿名 结构 体 中 成 员 的 字 节 对 齐 
情况 ， 见 表 6-1。 


表 6-1 代码 清单 6-20 中 匿名 结构 体 成 员 布 局 


成 员 对 象 标识 符 占用 存储 空间 大 小 偏 移 量 地 址 


表 6-1 列 出 了 结构 体 中 每 个 成 员 的 偶 移 地 址 、 对 齐 字 和 数 以 及 占用 
存储 空间 大 小 。 


1) 对 象 类 型 为 iInt8_t， 所 以 占 1 个 字 节 大 小 ， 对 齐 要 求 为 1 字 节 。 
由 于 它 是 第 一 个 成 员 ， 所 以 存放 在 偏 移 地 址 0 单元 处 。 


2) 对 象 是 第 二 个 成 员 ， 它 是 int32_t 类 型 ， 占 4 个 字 节 ， 因 此 对 齐 
要 求 为 4 字 节 。 由 于 偏 移 地 址 1 不 是 4 的 倍数 ， 所 以 需要 向 上 找 4 的 倍数 
的 最 小 整数 ， 这 样 正好 是 偏 移 地 址 4， 那 么 成 员 i 就 占用 了 偏 移 地 址 单元 
4 到 7， 而 偏 移 地 址 单元 1 到 3 正好 是 空 出 来 的 ， 用 0 来 填充 。 


3) 对 象 s 是 第 三 个 成 员 ， 类 型 为 int16 t， 占 2 个 字 节 ， 因 此 对 齐 要 
求 也 是 2 个 字 节 “。 由 于 偏 移 地 址 8 满足 2 的 倍数 ， 因 此 s 束 存放 在 偏 移 地 
址 8 处 ， 并 占用 偏 移 地 址 单元 8 和 9。 


4) 对 象 4 是 第 四 个 成 员 ， 它 是 int64_t 类 型 ， 占 用 8 个 字 节 ， 在 
Clang、GCC 与 MSVC 中 的 对 齐 要 求 也 是 8 字 节 。 由 于 偶 移 地 址 10 不 满足 
8 的 倍数 ， 因 此 需要 向 上 找到 是 8 的 倍数 的 最 小 整数 ， 因 此 它 被 存放 在 
偏 移 地 址 16 处 ， 并 占用 仿 移 地 址 单元 16 到 23。 


由 上 可 知 ， 整 个 结构 体 对 象 的 大 小 就 是 24 字 节 。 下 面 图 6-2 展 示 了 
结构 体 对 象 s 的 存储 布局 ， 该 图 是 在 Apple LLVM 8.0 编 译 环境 下 通过 
Xcode 集 成 开发 环境 捕获 到 的 。 
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图 6-2 ”结构 体 对 象 s 的 存储 布局 


图 6-2 中 ， 每 个 数 都 是 十 六 进 制 的 ， 表 示 一 个 字 帮 。 以 坚 线 划分 4 个 
字 市 为 一 组 ， 这 样 容易 观察 。 其 中 ， 数 值 0x10 处 于 偏 移 地 址 单元 0 处 ; 
数值 0x40 在 仿 移 地 址 16 处 。 通 过 这 个 图 我 们 可 以 很 直观 地 看 清 子 市 填 
充 与 对 齐 的 实现 。 


此 外 ， 在 C 语 言 标准 中 还 有 一 个 offsetof 安 ， 用 于 获取 当前 成 员 所 在 
的 偏 移 位 置 。 它 定义 在 <stddef.h> 头 文件 中 。 代 码 清 单 6-21 展 示 了 它 的 
用 法 。 


代码 清单 6-21 offsetof 的 使 用 


#include <stdio.h> 

#include <stddef.h> 

#include <stdalign.h> 

#include <stdbool.h> 

int main(int argc, const char * argv[]) 


struct S 


int16_t s; 


// 这 里 对 象 b 按 照 jnt32_t 类 型 的 对 齐 要 求 进行 对 齐 ， 即 4 字 节 对 广 
alignas(int32_t) bool b; 


int32_t 工 


// 这 里 定义 了 一 个 匿名 联合 体 ， 它 声 明 一 个 对 象 un 


// Un 按照 16 字 节 对 并 。 
// 这 里 需要 注意 ，un 的 对 齐 说 明 符 的 值 不 能 小 于 8， 
alignas(16) union 


其 成 员 最 大 对 齐 字 节 数 为 8 


Co 
六 | 
+ 


// 指定 成 员 c 的 对 齐 要 求 为 8 字 节 对 齐 
alignas(8) char c; 
float f; 

}un; // un 的 大 小 为 4 字 节 ， 且 按 16 字 节 对 广 


}; 


size_t offset = offsetof(struct S, s); 
printf("s offset is: %zu\n", offset); 


offset = offsetof(struct S, b); 
printf("b offset is: %zu\n", offset); 


offset = offsetof(struct S, i); 
printf("i offset is: %zu\n", offset); 


offset = offsetof(struct S, un); 
printf("un offset is: %zu\n", offset); 


printf("S alignment is: %zu\n", alignof(struct S)); 


以 上 我 们 描述 了 结构 体内 的 成 员 对 齐 以 及 字 市 填充 ， 而 之 前 提 到 
过 ，C 语 言 标准 允许 实现 对 结构 体 或 联合 体 的 末尾 做 子 节 填充， 而 填充 
大 小 也 是 由 实现 定义 的 。 一 般 来 说 ， 结 构 体 末尾 的 填充 根据 该 结构 体 
当前 成 员 最 大 对 齐 子 太 数 进行 填充 。 比 如 ， 如 琳 当 前 成 员 的 最 大 对 齐 
字 万 数 为 8 字 世 ， 那 么 俏 知 当前 结构 体 的 大 小 不 满足 8 字 世 的 倍数 ， 则 
填充 满 8 字 节 的 倍数 为 止 。 换 句 话 说， 结构 体 对 象 的 大 小 应 该 是 其 对 齐 
字 记 数 的 倍数 。 因 此 ， 当 确定 一 个 结构 体 最 后 一 个 成 员 的 位 置 与 大 小 
之 后 ， 后 面 所 填充 的 字 节 需要 保证 整个 结构 体 的 大 小 正好 与 其 对 齐 字 
世 数 成 倍数 关系 。 我 们 下 面 来 看 代码 清单 6-22 所 举 的 一 个 例子 。 


代码 清单 6-22 ”结构 体 末 尾 子 太 填 元 


#include <stdio.h> 
#include <stddef.h> 
#include <stdalign.h> 
#include <stdbool.h> 


int main(int argc，const char * argv[]) 


struct S 


int i; // 偏 移 地 址 为 96; 大 小 为 4 字 届 ;4 字 节 对 齐 


alignas(64) long double 1d; // 偏 移 地 址 为 64; 大 小 为 16 字 节 ; 64 字 节 对 齐 


char c; // 偏 移 地 址 为 80， 大 小 为 1 字 节 ; 1 字 节 对 齐 


}; 


printf("S alignment is: %zu\n", alignof(struct S)); 
printf("S size is: %zu\n", sizeof(struct S)); 


size_t offset = offsetof(struct S, i); 
printf("i offset: %zu\n", offset); 


offset = offsetof(struct S, 1d); 
printf("ld offset: %zu\n", offset); 


offset = offsetof(struct S, c); 
printf("c offset: %zu\n", offset); 
struct s2 
{ int 工 
char x, y, ZzZ, w; 
} 
printf("S2 alignment is %zu\n", alignof(struct S2)); 


printf("S2 size is %zu\n", sizeof(struct S2)); 
printf("w offset: %zu\n", offsetof(struct S2, w)); 


代码 清单 6-22 中 可 清晰 看 到 ， 由 于 结构 体 S 的 最 大 对 齐 字 市 数 的 成 
员 ]d 为 64 字 节 对 齐 ， 所 以 结构 体 S 的 对 齐 要 求 即 为 64 字 节 。 当 成 员 c 放 置 
在 偏 移 地 址 80 之 后 ， 和 需要 在 末尾 填充 值 为 0 的 字 广 ， 一 直到 结构 体 S 的 
大 小 能 满足 64 的 倍数 为 止 。 因 此 结构 体 S 的 最 终 大 小 为 128 子 三。 而 对 
于 结构 体 S2， 其 最 大 对 齐 成 员 类 型 为 int， 也 就 是 对 象 :， 因 此 它 也 以 4 
字 节 要 求 对 齐 。 最 后 4 个 x、y、z、w 成 员 都 是 单字 节 对 象 ， 因 此 均 满足 
对 齐 要 求 ， 所 以 S2 中 的 所 有 成 员 部 不 存在 字 太 填充 的 情况 。 此 外 ，S2 
大 小 在 默认 情况 下 已 经 是 8 字 方 了 ， 满 足 4 子 市 要 求 对 章 的 倍数 ， 因 此 
在 w 成 员 之 后 也 不 需要 额外 的 字 节 填充 。 


6.6 复数 类 型 


之 前 我 们 在 第 5 章 给 大 家 介绍 了 人 整数 类 型 与 浮 点 数 类 型 ， 这 两 种 类 
型 统称 为 实数 类 型 。 本 节 我 们 将 给 大 家 介绍 复数 (complex number) 
类 型 。 之 所 以 在 这 里 介绍 复数 类 型 是 因为 复数 本 身 束 是 一 个 复合 类 
型 ， 我 们 知道 一 个 复数 是 由 实 部 和 虚 部 构成 的 ， 因 此 在 C 语 言 中 一 个 
复数 对 象 也 具有 两 个 成 员 ， 一 个 表示 复数 的 实数 部 分 ， 另 一 个 表示 复 
数 的 虚数 部 分 


复数 类 型 从 C99 标 准 开始 引入 ， 并 且 复 数 的 实 部 与 虚 部 的 数据 类 
型 只 能 是 float、double 与 long double 这 三 种 浮 点 类 型 。 遵 循 GNU 语 法 扩 
展 的 C 语 言 实现 允许 复数 类 型 为 整数 类 型 ， 因 此 在 GCC 与 Clang 编 译 器 
中 都 能 使 用 整数 类 型 的 复数 。 声 明 一 个 复数 对 象 时 ， 使 用 _Complex 关 
键 字 ， 再 加 浮 点 类 型 。 比 如 ， 我 们 要 声明 一 个 实 部 与 虚 部 都 为 float 单 
精度 浮 点 类 型 的 复数 ， 使 用 float_Complex comp; 。 这 里 ， 关 键 字 
_Complex 与 类 型 名 可 以 互 换 位 置 。 


我 们 在 使 用 复数 时 ， 一 般 需 要 包 舍 头 文件 <complex.h>。 此 头 文件 
包含 了 诸多 对 复数 进行 操作 的 库 函 数 ， 包 括 取 复数 的 实 部 和 虚 部 的 值 
等 API。 此 外 ， 这 个 头 文件 中 还 定义 了 _Complex 的 简化 、 标 准 形 式 
complex。 因 此 ， 我 们 后 面 可 直接 用 complex 来 声明 一 个 复数 对 


象 ， 这 样 既 简洁 ， 而 且 又 能 跨 平 台 。 比 如 像 当 前 的 MSVC 并 不 直接 文 
持 复数 类 型 ， 但 支持 <complex.h> 标 准 库 头 文件 ， 并 以 结构 体 方式 给 出 
复数 实现 。 要 表示 一 个 复数 字面 量 可 以 直接 用 算术 表达 式 ， 比 如 
3.0f+0.5 攻 表示 一 个 实 部 为 3.0、 虚 部 为 0.5 的 一 个 单 精 度 浮 点 型 复数 。 这 
里 ， 后 缀 或 [表示 复数 的 虚 部 ， 一 般 建 议 使 用 大 写 的 I[， 这 也 是 在 
<complex.h> 所 定义 的 表示 虚 部 的 后 级 。I 可 以 放 在 表示 单 精度 浮 点 的 
后 缀 {之 前 ， 比 如 0.5If 也 是 合法 的 。 此 外 ， 虚 部 也 可 以 写成 诸如 0.5f*I 
这 样 的 表达 式 。 复 数 除 了 上 述 这 种 直接 写 表 达 式 的 形式 之 外 也 可 以 像 
结构 体 对 象 那样 初始 化 ， 比 如 : float_Complex comp={3.0f，0.5f}; ， 
这 里 复数 对 象 comp 的 实 部 为 3.0f、 虚 部 为 0.5f。 


上 面 我 们 描述 了 复数 对 象 的 声明 方法 以 及 初始 化 方式 。 除 了 上 运 
这 些 特性 外 ， 复 数 类 型 也 支持 类 似 于 结构 体 那样 的 复合 字面 量 。 比 
如 ， (float_Complex) {-1.25f，2.75f} 表 示 一 个 实 部 为 1.25、 虚 部 为 
2.75 的 单 精度 浮 点 复数 对 象 。 


遵循 GNU 语 法 扩展 的 编译 做 可 直接 通过 _real “操作 符 来 获取 复 
数 的 实 部 ， 通 过 ”imag_ 操作 符 来 获取 复数 的 虚 部 。 这 两 个 操作 符 的 
操作 数 应 该 是 一 个 复数 类 型 的 对 象 ， 且 操作 数 中 的 计算 副作用 仍然 会 
保留 ， 这 点 跟 sizeof 操 作 符 有 所 不 同 。 如 采 _real_ 与 _imag_ 的 操作 
数 是 一 个 实数 ， 那 么 该 实数 将 会 被 隐 式 地 转 为 一 个 复数 ， 该 复数 的 实 
部 与 实数 相同 (除非 涉及 浮 点 数 的 转换 ， 那 么 精度 可 能 会 有 所 影 


啊 ) ; 虚数 部 分 可 以 是 正 0 (对 于 浮 点 数 而 言 ) 或 无 符号 的 0。 当 我 们 
引入 了 头 文 件 <complex.h> 之 后 ， 我 们 可 以 使 用 标准 库 的 crealf 、creal 
和 creall 来 获取 复数 的 实 部 ，crealf 函 数 用 于 获取 类 型 为 单 精度 浮 点 
(float) 的 复数 的 实 部 ，creal 用 于 获取 类 型 为 双 精 度 序 点 (double) 的 
复数 的 实 部 ，creall 用 于 获取 类 型 为 扩展 双 精 度 浮 点 (long double) 的 
复数 的 实 部 。 而 cimagf、cimag、cimagl 这 些 库 函数 则 用 于 获取 复数 的 
虚 部 。 其 中 ，cimagf 用 于 获取 类 型 为 单 精度 浮 点 的 复数 的 虚 部 ，cimag 
用 于 获取 类 型 为 双 精 度 浮 点 的 复数 的 虚 部 ，cimagl 用 于 获取 类 型 为 扩 
展 双 精度 浮 点 的 复数 的 虚 部 。 此 外 ， 头 文件 <complex.h> 还 包含 了 用 于 
计算 复数 的 三 角 函 数 、 对 数 等 多 种 库 函 数 工 具 。 


复数 的 加 减 乘除 四 则 运算 与 实数 一 样 ， 可 直接 通过 +、-、*、/ 这 


些 运 算 符 进行 计算 。 此 外 ， 一 个 复数 可 以 转换 为 一 个 实数 ， 此 时 复数 
的 实数 部 分 转 为 实数 (数据 类 型 转换 遵循 实数 的 类 型 转换 规则 ) ， 而 


数 部 分 则 完全 舍弃 。 复 数 之 间 不 能 判别 大 小 ， 但 可 以 判别 是 否 相 
等 。 下 面 我 们 将 举 一 些 例子 来 描述 复数 的 一 些 使 用 方法 ， 见 代码 清单 


旺 


6-23。 
代码 清单 6-23 ”复数 的 使 用 


#include <stdio.h> 
#include <stdbool.h> 
#include <complex.h> 


int main(int argc, const char * argv[]) 


// 声明 了 一 个 单 精度 浮 点 型 复数 对 象 comp， 
// 并 用 一 个 复数 计算 表达 式 对 它 进行 初始 化 


float complex comp = 2.5f + 1.5fI， 


// 对 复数 comp 的 虚 部 加 3. Of 
comp += 3.0f * I; 


// 对 复数 comp 的 实 部 加 0 .5f 
comp += 0.5f; 


// 分 别 获取 复数 comp 的 实 部 和 虚 部 
float r = crealf(comp); 

float i = cimagf(comp); 

printf("r = %f, i = %f\n", r, 1i); 


// 这 里 声明 一 个 双 精 度 浮 点 型 的 复数 对 象 comp2， 
// 类 似 结构 体 的 方式 对 它 进行 初始 化 ， 其 实 部 为 10.5、 虚 部 为 9.5 
double complex comp2 = {10.5, 0.5}; 


r = creal(comp2); 
i = cimag(comp2); 
printf("r = %f, i = %f\n", r, 1i); 


// 这 里 声明 了 一 个 扩展 双 精 度 浮 点 型 的 复数 对 象 comp3， 
// 然后 没有 直接 对 它 进行 初始 化 
long double complex comp3; 


// 这 里 用 一 个 扩展 双 精 度 浮 点 型 的 复数 字面 量 赋值 给 comp3 
comp3 = (float complex){ -1.25L, 2.75L }; 


// 分 别 获取 comp3 的 实 部 与 虚 部 

r = creall(comp3); 

i = cimagl(comp3); 

printf("r = %f, i = %f\n", r, 1i); 


// 这 里 复数 comp2 直 接 转 为 double 类 型 ， 然 后 赋值 给 f 变 1 
// 此 时 ，comp2 的 实 部 将 double 类 型 转 为 float 类 型 赋值 给 丢弃 虚数 部 分 
float f = comp2; 

printf("f = %f\n", f); 


// 可 以 将 一 个 实数 直接 赋值 给 一 个 复数 对 象 ， ee 

// 这 里 将 整数 109 转 换 为 float 类 型 ， 然 后 赋值 给 复数 的 实数 部 分 ， 其 虚数 部 分 为 9 
comp = 100; 

printf( "comp real is: %f, imag is: %f\n", crealf(comp), cimagf (comp)); 


// 这 里 对 comp2 做 复数 的 四 则 运算 
Comp2 = (comp2 + (0.25 - 3.0I)) / comp3; 
printf("comp2 real is: %f, imag is: %f\n", creal(comp2), cimag(comp2)); 


// 复数 之 间 不 能 用 >、>=、<、<= 来 比较 大 小 ， 但 可 以 使 用 == 及 != 来 判断 是 否 相 等 
bool b = comp == (float complex){100.0f, 0.0fI}; 
printf("Is equal? %d\n", b); 


代码 清单 6-23 展 示 了 上 述 所 讲 的 天 于 复数 使 用 的 一 些 基 本 语法 特 
包括 对 复数 的 初始 化 、 赋 值 、 复 合 字 面 量 、 获 取 实 部 与 虚 部 、 四 


则 运算 、 比 较 是 否 相 等 、 与 实数 之 间 的 转换 等 。 


C11 标 准 还 提供 了 C 语 言 编译 絮 可 选 实现 的 _Imaginary 类 型 ， 表 示 
纯 虚 数 。 不 过 这 个 特征 没有 被 当前 主流 编译 右 的 任何 一 款 所 文 持 ， 这 
里 不 做 展开 介绍 。 不 过 其 用 法 与 _Complex 差 不 多 ， 只 不 过 表示 的 数据 
对 象 为 一 个 纯 虚 数 。 如 宁 纯 虚数 类 型 被 C 编 译 需 文 持 ， 那 么 在 
<complex.h> 头 文件 中 我 们 也 能 直接 使 用 imaginary。 不 过 由 于 complex 
所 引入 的 复数 类 型 已 经 泗 盖 了 纯 虚 数 ， 所 以 一 般 编 译 右 也 不 会 再 去 文 


持 imaginary 。 


6.7 ”本章 小 绪 


本 章 给 大 家 介绍 了 枚 举 、 绪 构 体 、 联 合体 等 用 户 目 定义 类 型 ， 其 
中 绪 构 体 又 称 为 聚合 类 型 。 最 后 又 介绍 了 复数 类 型 。 目 此 ，C 语 言 
的 对 象 类 型 束 已 经 全 部 介绍 完了 。 其 他 出 现 的 类 型 都 将 是 这 些 对 象 类 
型 的 引申 。 


下 一 章 我 们 将 介绍 C 语 言 中 的 一 个 重点 语法 一 一 指针 。 它 是 数据 
对 象 的 一 个 属性 ， 并 且 伴 随 着 本 章 与 第 5 章 所 介绍 的 类 型 。 


第 7 章 ”CC 语言 的 数组 与 指针 


本 章 将 介绍 C 语 言 中 的 数组 与 指针 。 有 不 少 程序 员 都 称 C 语 言 中 的 
日 针 是 整个 C 语 言 的 精 散 ， 尽 管 个 人 认为 C 语 言 的 真正 精 散 是 其 整个 类 
型 系统 (type system) ， 但 指针 确实 也 扮演 着 非常 核心 的 角色 。 所 以 
对 于 C 语 言 初学 者 来 说 ， 学 好 指针 是 十 分 关键 的 。 


本 章 将 先 介 绍 C 语 言 中 的 数组 ， 然 后 介绍 指针 以 及 指针 与 数组 的 
天 系 ， 随 后 再 介绍 一 下 C 语 言 的 字符 串 字 面 量 ， 最 后 介绍 C 语 言 的 完整 
类 型 与 不 完整 类 型 。 其 中 ， 数 组 与 指针 都 属于 对 象 类 型 的 一 个 类 别 

(category) ， 其 中 数组 与 结构 体 一 样 ， 也 属于 聚合 类 型 。 


1 一 外 类 省 


一 维 数组 是 C 语 言 中 比较 常用 的 窜 合 类 型 ， 它 表示 一 组 具有 相同 类 
型 的 多 个 元 素 的 有 序 组 合 。 声 明 一 个 一 维 数组 的 基本 形式 为 : 


< 类 型 名 > < 对 象 标识 符 > [ ”< 数组 元 素 个 数 > ]， 


其 中 ， 数 组 元 素 个 数 可 以 是 一 个 计算 表达 式 。 在 C99 之 前 ， 计 算 表 
达 却 必须 是 一 个 整数 音量 表达 式 ， 而 在 C99 之 后 ， 它 可 以 不 必 为 整数 般 
量 表达 式 ， 一 个 需要 在 运行 时 计算 的 整数 变量 表达 式 也 能 用 来 指定 一 
个 数组 的 元 素 个 数 。 如 果 指 定数 组 长 度 的 表达 式 是 一 个 变量 ， 或 者 需 
要 在 运行 时 才能 确定 的 值 ， 那 么 该 数组 又 被 称 为 变 长 数组 (variable 
length array) ， 这 将 在 后 续 的 7.3 节 中 做 详细 介绍 。 表 示 数 组 元 素 个 数 
的 常量 表达 式 的 值 应 该 是 一 个 正 整数 ;而 在 GNU 语 法 扩展 中 ， 人 允许 这 
里 的 常量 表达 式 为 0， 表 示 一 个 长 度 为 0 的 空 数组 ， 该 数组 对 象 占用 0 个 
字 万 的 存储 空间 。 


由 于 数组 由 一 个 或 多 个 相同 类 型 的 对 象 组 成 ， 所 以 我 们 可 以 访问 
数组 对 象 中 的 任 一 元 素 。 访 问 数 组 的 某 一 元 聚 时 ， 我 们 使 用 数组 对 象 
标识 符 ， 然 后 后 面 加 牛 。 其 中 ， 数 组 对 象 标识 符 是 一 个 后 绥 表 达 式 ，[] 
是 一 个 下 标 操作 符 (subscript operators) ， 它 是 一 个 单 目 操作 符 ， 其 前 
面 的 后 组 表达 式 则 作为 它 的 操作 数 。 咎 表示 的 是 数组 下 标 ， 数 组 下 标 


中 可 以 指定 整数 帅 量 表达 式 或 整数 变量 作为 指定 当前 的 数组 元 素 索引 
(index) ， 比 如 上 面 0] 中 的 i。 数 组 下 标 索引 值 可 以 是 正 数 ， 也 可 以 是 
负数 ， 或 者 0。 负 数 索 引 值 一 般 用 于 指针 对 象 ， 而 不 直接 用 于 数组 对 象 
本 身 。 访 问 数组 对 象 的 第 1 个 元 素 时 ， 使 用 下 标 [0]， 访 问 第 2 个 元 素 使 
用 下 标 [1]， 然 后 依 此 类 推 。 


对 一 个 数组 对 象 的 初始 化 使 用 {}， 作 为 其 初始 化 器 ， 里 面 存放 相 
应 元 素 进行 初始 化 的 初始 化 器 列表 。 如 果 列 表 长 度 小 于 数组 本 吴 的 长 
度 ， 那 么 后 面 多 出 来 的 元 素 部 分 被 初始 化 为 0。 从 C99 标 准 开始 ， 可 以 
通过 指定 数组 下 标的 方式 为 数组 元 素 进行 初始 化 ， 这 也 被 称 为 受 指定 
的 初始 化 器 (designated initializer) 。 


下 面 举 一 些 简单 的 例子 来 描述 一 维 数组 的 对 象 声 明 以 及 对 其 元 素 
的 访问 。 


代码 清单 7-1 一 维 数组 的 初始 化 及 元 素 访问 


#include <stdio.h> 
#include <stdbool.h> 
#include <complex.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 
// 声明 一 个 含有 5 个 类 型 为 char 的 元 素 的 数组 对 象 
1h 'c'、'd'、'e' 对 其 进 


C， 
// 并 分 别 用 'a'、'b'、 J 初始 化 
char c[2*2+1]={'a', 'b', 'c', 'd', 'e' } 


// 分 别 将 数组 c 的 第 1 个 元 素 到 第 5 个 元 素 的 值 打印 出 来 
printf("c[0] = %c, c[1] = %c, c[2] = %c, c[3] = %c, c[4] = %c\n", 
c[O], c[1], c[2], cL3], c[4]); 


// 声明 一 个 含有 4 个 类 型 为 int32_t 的 元 素 的 数组 对 象 a， 
// 并 分 别 用 109， -1，9，0 对 它 进行 初始 化 ， 

// 数组 的 初始 化 列表 来 尾 也 可 以 添加 一 个 额外 的 有 逗号 
int32 t a[4] = { 100, -1, }; 


// 将 数组 a 的 第 1 个 到 第 4 个 元 素 的 值 都 打印 出 来 
printf("a[0] = %d, a[1] = %d, a[2] = %d，a[3] = %d\n", 
a[9]，al1]，a[2]，a[3]); 


// 声明 一 个 含有 5 个 类 型 为 fLoat 的 元 素 的 数组 对 象 f， 
// 对 其 第 二 个 元 素 初 始 化 为 10 .5f， 第 4 个 元 素 初 始 化 为 -0 .5f， 其 余 元 素 均 为 0 .Of 
float f[5] = { [1] = 10.5f, [3] = -0.5f }; 


// 将 数组 f 的 第 1 到 第 5 个 元 素 的 值 都 打印 出 来 
printf("f[9] = %f, f[1] = %f, f[2] = %f, f[3] = %f, f[4] = %f\n", 
f[0], f[1], f[2], f[3], f[4]); 


// 声明 一 个 含有 3 个 类 型 为 int32_t 的 元 素 的 数组 b， 
// 然后 用 之 前 的 c[6] ，a[9] ， 人 初始 化 。 
// 这 里 在 声明 数组 b 的 时 候 不 指明 其 
// 此 时 将 通 过 初始 化 列表 中 郑 素 的 不 数 来 确定 其 元 元 素 个 数 
int32 t b[] ={cr[9]，a[9]，f[1] }; 


// 这 里 仅 声 明了 一 个 含有 3 个 类 型 为 int32_t 的 元 素 的 数组 d ， 
// 0 个 元素 都 没有 被 初始 化 ;如果 没 有 初始 化 列表 ， 那 么 必须 指定 数组 元 素 个 数 
int32_t d[3]; 


// 分 别 为 数组 d 的 三 个 元 素 赋值 


L 


d[90] = b[2]; // 将 数组 b 的 第 3 个 元 素 赋值 给 数组 d 的 第 1 个 元 素 
d[1] = b[1]; // 将 数组 b 的 第 2 个 元 素 赋值 给 数组 d 的 第 2 个 元 素 
d[2] = b[9]; // 将 数组 b 的 第 1 个 元 素 赋值 给 数组 d 的 第 3 个 元 素 
// 将 数组 d 的 三 个 元 素 的 值 分 别 打印 出 来 


printf("d[9] = %d, d[1] = %d, d[2] = %d\n", 
d[6], d[1], d[2]); 


// 这 里 声明 了 一 个 含有 8 个 int16_t 类 型 元 素 的 数组 $s， 并 对 它 进行 初始 化 ， 
// 使 用 了 指定 下 标的 初始 化 器 与 顺序 下 标 初 始 化 器 的 混合 方式 ， 
// 此 时 确定 数组 对 象 元 素 个 数 的 方式 为 : 判定 初始 化 列表 中 指定 下 标的 最 大 索引 值 ; 
// 然后 将 此 最 大 下 标 索引 值 加 1 就 是 该 数组 对 象 元 素 的 个 数 ， 
里 ， 指 定 下 标 初 始 化 器 的 下 标 最 大 索引 值 为 6， 所 以 一 共 是 7 个 元 素 。 
// 其 中 第 1 个 元 素 为 -1; 第 2 个 元 素 为 2， 第 3 个 个 元 到 为 6; 第 4 个 元 素 为 19; 
// 第 5 个 元 素 为 1， 第 6 个 元 素 为 20， 第 7 个 元 素 为 5 
// 当 指 定 下 标 初始 化 器 之 下 员 应 下 位 妇 的 化 时 


// 此 顺序 下 标的 索引 值 为 神 一 个 指定 下 标的 索引 值 加 1， 所 以 这 里 最 后 一 个 值 为 26 的 元 素 的 下 标 索 引 为 5 
int16 t s[] = { -1, 2, [3] = 10, [6] = 5, [4] = 1, 20 } 


// 将 数组 s 的 各 个 元 素 的 值 都 分 别 打印 出 来 
printf("s[0] = %d, s[1] = %d, s[2] = %d, s[3] = %d\n", 
. s[0], s[1], s[2], s[3]); 
printf("s[4] = %d, s[5] = %d, s[6] = %d\n", 
s[4], s[5], s[6]); 


struct T 


- 


了 


int32_t a, b; 


// 这 里 声明 了 一 个 含有 4 个 元 素 的 struct T 结 构 体 类 型 的 元 素 的 数组 
// 此 声 明 包含 了 各 种 有 效 的 结构 体 对 象 元 素 初 始 化 器 与 数组 初始 化 器 进行 有 效 混用 的 方 
// 其 中 第 一 个 元 素 的 初始 化 器 展示 了 可 完全 将 其 各 个 成 员 的 值 按 次 ) 亨 摆 在 数组 初始 化 列 录 
// 第 二 个 元 素 的 初始 化 器 则 是 使 用 了 更 直观 的 { 3 来 初始 化 其 结构 体 成 员 ; 
// 第 三 个 元 素 是 用 了 指定 下 标的 数组 初始 化 器 结合 指定 成 员 的 结构 体 初始 化 器 ; 
// 第 四 人 个 元 素 则 是 分 分 别 对 其 结构 体 成 员 进行 初始 化 _ 
/** “数组 对 象 t 的 内 容 如 所 示 (由 Xcode 调试 器 展示 出 ) 


| 
9 


FT 出 
bul 
Em 


己 


(T [4]) t= 

[6] = (a = 16，b = 20) 
[1] = (a = 1, b = 2) 
[2] = (a = -1, b = -2) 
[3] = (a = 4, b = 5) 
} 


*/ 
TL 2 2}, [2] = {.a = -1, .b = -2}， 
[3].a = 4, [3].b = 5 }; 


代码 清单 7-1 详 细 描 述 了 数组 对 象 的 声明 、 初 始 化 以 及 元 素 访 问 。 
为 了 直观 ， 后 面 我 们 统一 将 a[0] 精 简 地 描述 为 数组 对 象 a 的 0 号 元 素 ， 
也 表示 数组 a 的 第 一 个 元 素 ， 这 样 表述 更 为 直观 ， 且 不 会 引起 概念 上 的 
紊乱 ， 而 且 也 比 “下 标 索 引 为 0 的 元 素 ” 的 表达 要 更 为 精简 。 


一 个 一 维 数 组 对 象 ， 比 如 int a[10]; 其 类 型 为 int[10]， 表 示 含 有 10 

个 int 类 型 对 象 的 数组 类 型 ， 对 象 的 类 型 类 别 为 数组 。 一 个 数组 对 象 中 
的 元 素 通 常 是 按照 从 低地 址 到 高 地 址 的 顺序 来 存放 的 。0 号 元 素 放 在 数 
组 对 象 的 起 始 地 址 ，1 号 元 素 放 在 数组 对 象 的 起 始 地 址 加 上 数组 元 素 类 
型 的 长 度 所 得 的 地 址 处 。 当 一 维 数组 对 象 作 为 sizeof 的 操作 数 时 ，sizeof 
操作 符 所 返回 的 结果 为 该 数组 元 素 个 数 乘 以 该 数组 元 素 类 型 的 长 度 。 
比如 ， 上 述 的 数组 对 象 a，sizeof (a) 的 结果 就 相当 于 10*sizeof 

(int) ， 在 32 位 或 64 位 系统 下 ， 结 果 就 是 40。 也 就 是 说 ， 数 组 对 象 所 
占 的 存储 空间 为 40 个 字 节 。 图 7-1 展 示 了 int b[3]={1，2，3} 的 存储 空间 
布局 (在 Apple LLVM 8.0，macOS 10.12 系 统 下 运行 得 出 ) 。 


团 | < | 国 CDemo ) 其 oxzfff5fbff8oc 


7FFF5FBFF800 01 680 00 00 02 80 80 00 03 00 080 080 
图 7-1 一 维 数 组 对 象 b 的 某 个 存储 布局 


图 7-1 展 示 了 上 壕 数 组 对 象 b 在 macOS 10.12 下 运行 时 的 存储 布局 。 
这 里 说 明 一 下 ， 数 组 b 对 象 自身 所 在 的 地 址 为 0x7fff5fbff80c， 其 0 号 元 
素 1 所 在 地 址 就 是 0x7fff5fbff80c， 其 1 号 元 素 2 所 在 地 址 为 
0x7fff5fbff810， 其 2 号 元 素 3 所 在 地 址 为 0x7fff5fbff814。 数 组 对 象 b 的 总 


Pid woh 


数组 类 别 的 对 象 与 其 他 对 象 不 同 ， 不 能 将 一 个 数组 对 象 直接 赋值 
给 另 一 个 数组 对 象 ， 即 便 对 一 个 数组 对 象 进 行 初始 化 时 也 同样 如 此 ， 
但 这 里 有 一 个 例外 束 是 匿名 数组 对 象 即 数 组 的 复合 字面 量 ) 可 以 在 
对 某 个 数组 对 象 初始 化 时 直接 赋值 给 它 。 要 把 一 个 数组 对 象 中 的 某 些 
元 素 赋值 给 另 一 个 数组 对 象 的 某 些 元 素 时 ， 通 常 使 用 单个 元 素 赋值 的 
方式 ， 或 是 通过 <string.h> 中 声明 的 库 函 数 memcpy 做 字 蔬 揽 贝 。 代 码 清 
单 7-2 展 示 了 匿名 数组 的 形式 以 及 给 数组 元 素 赋 值 的 方式 。 


代码 清单 7-2 ”匿名 数组 的 形式 以 及 给 数组 元 素 赋值 的 方式 


#include <stdio.h> 
#include <string.h> 


int main(int argc, const char * argv[]) 


// 这 里 声明 了 数组 对 象 a， 其 类 型 为 nt[3]， 接 用 初始 化 列表 对 它 初 始 化 
int a[] = { 1, 2, 3 }; 


// 输出 数组 对 象 a 的 大 小 


printf("a Size is: %zu\n", sizeof(a)); 


// 这 里 声明 了 数组 对 象 b， 其 类 型 为 nt[3]， 匿名 数组 对 象 对 它 初 始 化 ， 
// 该 匿名 数组 对 象 的 类 型 也 是 int[3]。 

// 这 里 倘若 使 用 int b[] = a; 这 种 方式 对 b 进 行 初 始 化 ， 则 会 引发 编译 错误 
int b[] = (int[]){ 4, 5, 6 }; 


// 输出 数组 对 象 b 的 元 素 个 数 
// 这 里 我 们 通过 数组 对 象 b 的 总 字 节 数 除 以 其 每 个 元 素 占用 多 少 字 节 来 获得 其 元 素 个 数 
printf("b elments count: %zu\n", sizeof(b) / sizeof(b[0])); 

// 在 使 用 匿名 数组 给 一 个 数组 对 象 进行 初始 化 时 ， 类 型 必须 匹配 。 


> 


// 这 里 一 维 数 组 对 受 C 革 名 数组 对 家 的 舌 型 均 人 nt 

// 如 这 里 匿名 数组 的 元 素 个 数 不 是 19， 则 会 引发 编译 报错 

// 这 里 ， 匿 名 数组 对 象 一 共 含有 10 个 int 类 型 对 象 ， 

// 其 中 9 号 元 素 值 为 1; 2 号 元 素 值 值 为 - 1; ha 2， 其 余 元 素 值 均 为 9 
int c[10] = (int[10]){ [0] = 1, [2] = -1, -2 }; 

// 声明 一 个 数组 对 象 d， 其 类 型 为 nt [29] ， 表 示 含 有 20 个 int 对 象 元 素 的 一 维 数组 


// 然后 没有 对 d 直 接 做 初始 化 ， 其 每 个 元 素 的 值 都 是 不 确定 的 
int d[20]; 


// 我 们 用 库 函 数 nemcpy 先 对 数组 对 象 d 的 前 10 个 元 素 进行 研 值 。 
// 这 里 使 用 数组 对 象 c 的 所 有 元 素 找 贝 到 数组 d 的 前 10 
// memcpy 的 第 一 个 参数 为 有 拷贝 的 目的 数据 地 址 ; 第 二 不 参数 为 源 数据 地 址 ， 
// 第 三 个 参数 表示 要 拷贝 的 总 字 节 数 


memcpy(d, c, sizeof(c)); 


// 随后 我 们 分 别 对 数组 对 象 d 的 12、14、16 号 元 素 进 行 赋值 
d[12] = b[9 

d[14] = 

d[16] = 


3 


/ 


a[9] ; 
a[l1] + b[1]; 


es 


// 最 后 ， 我 们 匿 19 号 元 素 进行 赋值 。 

// 由 于 这 里 的 memcpy 是 一 个 安 ， 而 不 是 普通 函数 ， 
// 因此 ， 这 里 在 村 名 数组 对 象 外 又 用 了 一 个 圆 括号 来 避免 宏 内 部 处 理 所 引 发 的 问题 ， 
// 一 般 情 况 下 ， 最 外 层 的 圆 括号 是 可 省 的 

memcpy(&d[17] ， ((int[]){7, 9, 8}), 3 * sizeof(int)); 


代码 清单 7-2 详 细 介 绍 了 匿名 一 维 数 组 对 象 的 使 用 方法 以 及 数组 的 
初始 化 与 赋值 的 约束 。 这 里 大 家 要 注意 的 是 ， 使 用 库 函 数 memcpy 时 ， 
必须 对 引 入 头 文 件 <string.h>。 在 语句 块 作用 域 声 明 的 一 个 数组 对 象 ， 
符 未 经 初始 化 ， 那 么 其 每 个 元 素 的 值 都 是 不 确定 的 。 如 采访 问 一 个 数 
组 对 象 的 下 标 索 引 超 出 了 数组 对 象 本 喘 的 大 小 ， 则 可 能 引发 程序 异 
常 。 比 如 在 代码 清单 7-2 中 ， 如 膝 有 像 “a[3]=4; ”这 样 的 赋值 语句 ， 那 
么 在 执行 这 条 语句 时 就 可 能 引发 程序 崩 演 ， 由 于 数组 a 一 共 只 有 3 个 元 
素 ， 有 效 下 标 索 引 值 从 0~~2， 而 下 标 索 引 值 3 超出 了 这 个 范围 ， 所 以 此 
时 对 a[3] 进 行 访问 整改 生 了 数组 访问 越界 问题 。 


7.2 多维 数组 


7.1 市 我 们 介绍 了 一 维 数组 对 象 以 及 数组 对 象 的 各 种 特性 ， 包 括 如 
何 初 始 化 、 如 何 为 其 元 素 赋 值 等 。 本 万 我 们 将 介绍 多 维 数组 。 多 维 数 
组 在 科学 计算 上 用 得 无 为 多 ， 比 如 ， 如 采 一 个 一 维 数组 能 表示 一 个 同 
量 的 话 ， 那 么 二 维 数 组 就 能 用 来 表示 一 个 MxN 的 答 阵 ， 而 更 多 维 的 数 
组 则 能 表示 更 多 维度 的 数据 。 


形式 如 int a[2][3]; 表示 声明 了 一 个 二 维 数组 对 象 a， 其 类 型 为 int[2] 
[3]， 表 示 含 有 2 个 int[3] 类 型 的 数组 。 习 惯 上 ， 我 们 很 多 时 候 也 会 将 其 
描述 为 具有 2 行 3 列 的 int 类 型 元 素 的 数组 。 不 过 无 论 怎么 描述 ， 有 一 点 
必须 清楚 ， 那 就 是 数组 对 象 的 每 个 元 素 都 是 int[3] 类 型 。a[0] 表 示 数 组 a 
的 0 号 元 素 ， 它 是 一 个 具有 3 个 int 元 素 的 数组 ; af[0][0] 表 示 数 组 at0 号 元 
素 〈 即 一 个 int[3] 类 型 数组 ) 中 的 0 号 元 素 。a[1][2] 则 表示 数组 a 的 1 号 元 
素 中 的 2 号 元 素 。 


二 维 数组 的 初始 化 与 元 陛 访 问 如 代码 请 单 7-3 所 示 。 
代码 清单 7-3 ”二 维 数组 的 初始 化 与 元 素 访问 


#include <stdio.h> 
#include <string.h> 


int main(int argc, const char * argv[]) 
0 个 二 维 数 组 对 象 4， 其 类 型 为 jnt[2] [3]， 


0 可 2 人 位 nt[3] 关 型 的 元 娄 的 玫 组 ， 然后 用 数组 初始 化 列表 进行 初始 化 
int al] < ={ 


// 对 数组 a 的 9 号 元 素 进 行 初 始 化 


// 数组 a 的 0 号 元 素 是 一 个 jnt[3] 数 组 ， 其 每 个 元 素 初 始 化 完 之 后 
// 分 别 为 : 1，2，3 

{1, 2, 3}, 

// 对 数组 a 的 1 号 元 素 进行 初始 化 
// 数组 a 的 1 号 元 素 是 一 个 jnt[3] 数 组 ， 其 每 个 元 素 初 始 化 完 之 后 


// 分 别 为 : 4，5，6 


{4, 5， 
】 


6} 


// 这 里 分 别 打 


// 以 及 数组 ab 


printf("a[0 
a[0] 


印 数组 a 的 9 号 元 素 中 的 1 号 元 素 ， 

多 1 号 元 素 中 的 2 号 元 素 

][1] = %d，a[1][2] = %d\n", 
[1]，a[1][2])， 


// 输出 数组 对 象 a 的 大 小 
// 数组 对 象 a 的 大 小 为 2 * 3 * sizeof (int), kK24 个 字 节 
printf("size of a is: %zu\n" sizeof (a)); 
// 对 一 个 二 维 数组 的 初始 化 也 能 扁平 化 为 像 对 一 个 一 维 数组 那样 进行 初始 化 。 
// 这 里 数组 b 的 每 个 元 素 的 值 与 数组 a 中 的 完全 一 致 ， 
// 所 以 ， 这 里 的 初始 化 列表 与 上 述 a 的 初始 化 列表 是 等 效 的 
int b[2][3] = { 
1, 2, 3, 4, 5, 6 
}; 
// 输出 b[9] 的 大 小 ; 由 于 b[9] 为 int[3] 类 型 ， 所 以 大 小 为 3 * 4 = 12 字 
printf("size of b[0] is: %zu\n", sizeof(b[0])); 
// 在 声明 一 个 二 维 数组 对 象 时 ， 倘若 直接 对 它 进行 初始 化 ， 
// 那么 其 元 素 个 数 可 以 不 指明 ， 但 每 个 元 素数 组 关 开 必须 明确 指定 
// 这 里 ， 数 组 对 象 c 的 每 个 元 素 为 int[3] 类 型 ， 这 里 的 3 不 能 缺 省 
// 最 终 c 的 类 型 为 jnt [4] [3] 
int c[][3] = { 
// 对 其 9 号 元 素 进行 初始 化 
[09] = { 1, 2 3 3, 
[2] = { 4, 5 }, // 1 号 元 素 的 数组 元 素 均 为 0%，，c[2][2] 也 为 6 
// 这 里 使 用 指定 元 素 的 初始 化 器 
[3][0] = b[1][2]，[3][2] = 7 // c[3][1] 的 值 为 9 
printf("c[0][0] = %d, c[1][1] = %d, c[2][2] = %d, c[3][90] = %d\n", 
c[6][6], c[1][1], ct2][2], cr3][9]); 
// 如 果 在 语句 块 作用 域 中 声明 一 个 二 维 数组 ， 但 没有 对 它 直 接 初 始 化 ， 
// 那么 必须 指明 该 数组 对 象 的 元 素 个 数 ， 因 此 这 里 的 2 不 能 省 
int d[2][3]; 
// 将 数组 b 的 元 素 拷贝 到 数组 d 对 象 中 
memcpy(d, b, sizeof(d)); 
// 这 里 修改 d[1][2] 的 什 


d[1][2] = cL3][2]; 
printf("d[9][9] = %d, d[1][2] = %d\n", d[0][90], d[1][2]); 


// 声明 了 一 个 二 维 数组 对 象 e， 个 匿名 二 维 数 组 对 象 对 齐 初始 化 
// e 的 类 型 为 nt [3] [4] 
int e[]j[4] = (int[][4])t 
{ 1, 了 3 天 
[1] ={4，5，6 }, 
, {7, 8, 9}, // 初始 化 列表 的 末尾 允许 添加 一 个 额外 的 逗号 


printf("e[0][0] = %d 
e[6]16]，e[1]f1]，e[2][2]); 


e[1][1] = %d, e[2][2] = %d\n", 


代码 清 蛙 7-3 展 示 了 二 维 数组 的 多 种 初始 化 方式 ， 包 括 直 接 使 用 初 
台 化 列表 以 及 使 用 匿名 二 维 数组 对 象 ， 另 外 ， 也 介绍 了 二 维 数组 初始 
化 列表 中 的 指定 元 素 下 标的 初始 化 器 以 及 顺序 下 标的 初始 化 右 ， 随 
后 ， 叉 介绍 了 二 维 数 组 元 到 的 拷贝 以 及 对 单个 元 素 的 访问 方式 。 


二 维 数 组 的 元 素 存 储 方式 与 一 维 数 组 类 似 。 由 低地 址 到 高 地 址 ， 
先 存放 0 号 元 素 中 的 所 有 元 素数 据 ， 然 后 再 存放 1 号 元 素 中 的 所 有 元 素 
数据 ， 以 此 类 推 。 图 7-2 展 示 了 代码 清单 7-3 中 二 维 数组 对 象 a 的 元 素 存 
储 布局 。 
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图 7-2 ”二 维 数组 对 象 a 的 元 素 存 储 布局 


图 7-2 中 ， 二 维 数组 对 象 a 的 首 地 址 为 0x7fff5fbff800， 其 0 号 元 素 为 
一 个 int[3] 类 型 的 数组 ， 这 个 数组 中 的 元 素数 据 先 存放 在 与 a 相 同 的 首 地 
址 处 ， 然 后 每 个 元 素 依 次 存放 在 0x7fff5fbff800、0x7fff5fbff804 、 
0x7fff5fbff808 处 ; 二 维 数组 对 象 4 的 1 号 元 素 也 是 一 个 int[3] 类 型 的 数 
组 ， 它 存放 在 0x7fff5fbff80c 处 ， 并 且 其 每 个 元 素 依次 存放 在 地 址 
0x7fff5fbff80c、0x7fff5fbff810、0x7fff5fbff814 处 。 整 个 数组 对 象 a 所 占 


存储 空间 为 24 个 字 节 。 


除了 二 维 数组 ， 我 们 还 可 以 声明 三 维 、 四 维 ， 甚 至 更 高 维度 的 数 
组 ， 至 于 最 多 能 文 持 多 少 维 数 组 是 由 C 语 言 实现 自己 定义 的 ， 不 过 一 般 
支持 到 十 维 数组 问题 都 不 大 。 多 维 数 组 的 构造 形式 与 二 维 数组 类 似 。 
比如 ，int a[2][3][4]; 声明 了 一 个 三 维 数 组 对 象 4，a 的 类 型 为 int[2][3] 
4]，a[0] 的 类 型 为 int[3][4]，a[0]J[0] 的 类 型 为 int[4]。 这 也 就 是 说 ， 三 维 
数组 对 象 a 中 含有 两 个 元 素 ， 且 每 个 元 素 都 是 一 个 int[3][4] 的 二 维 数组 对 
象 。 四 维 数组 也 类 似 ， 比 如 intb[2][3][4][5]; 声明 了 一 个 四 维 数组 对 象 
b， 其 类 型 为 int[2][3][4][5]， 共 有 两 个 元 素 ， 每 个 元 素 为 类 型 是 int[3][4] 
[5] 的 三 维 数组 对 象 。 三 维 、 四 维 数组 的 元 素 存 储 布局 也 与 二 维 数组 的 
类 似 ， 都 是 按照 从 低地 址 到 高 地 址 依次 存放 每 个 元 素 的 数据 内 容 的 。 
代码 清单 7-4 描 述 了 三 维 数 组 的 一 些 基 本 操作 。 


代码 清单 7-4 三维 数 组 的 一 些 基本 操作 


#include <stdio.h> 
#include <string.h> 


int main(int argc, const char * argv[]) 
{ 
声明 一 个 三 维 数组 对 象 a， 其 类 型 为 int[2][3][4] 


2 其 每 个 元 素 的 类 型 为 int [3][4 ] 
int 302] L316] = ={ 


// 元 素 
{ 

{ 1, 2, 3, 4 }, 

{ 57 6, 7 8 村 

{ 9，10，11，12 }， // 这 里 可 添加 一 个 额外 的 逗号 
}, 
// 1 号 元 素 

{ -1, -2, -3, -4 }, 

{-5, -6 本 1 

{ -9, -10, -11, -12 } 
}， // 这 里 的 添加 一 个 额外 的 逗号 


printf("a[0][90][0] = %d，a[1][1][1] = %d\n" 
a[6][6][6], ar1][1][1]); 


// 声明 一 个 三 维 数组 对 象 b， 和 


// 这 里 可 以 用 与 一 维 数组 初始 化 列表 相同 的 方式 为 其 初始 化 。 
// 三 维 数组 的 元 素 个 数 可 省 ， 这 样 根据 初始 化 列表 来 确定 其 元 素 个 数 ， 
// 但 其 每 个 元 素 的 类 型 必须 指明 ， 所 以 这 里 的 [3] [4] 中 的 任何 值 都 不 能 缺 省 


int PLE3L4 = { 
素 


0 号 元 


/ 

-1, -2, -3, -4, 

-5, Tp 

-9, -10, -11, -12 

}; 

// 此 时 ， 数 组 b 的 元 素 内 容 与 数组 a 的 完全 相同 
printf("b[9][1][1] = %d，b[1][2][2] = %d\n", 
b[6]T1]T1]，b[1][2][2] ); 


// b 的 大 小 为 2 * 3 * 4 * sizeof(int) = 96， 即 占用 96 个 字 节 的 存储 空间 
printf("b size is: %zu\n", sizeof(b)); 


// 三 维 数组 对 象 的 初始 化 列表 也 能 使 用 指定 元 素 索 引 的 初始 化 器 
// 这 里 未 受 指 定 的 元 素 的 值 都 将 被 初始 化 为 9 


int c[3][2][4] = { 
X27 初始 化 9 号 元 素 


[9] = { fy 2, 3, 4}, {5, 6, 7, 8} 小 

// 初始 化 1 号 

人 [oa bdr :8 4 [2] = -5 -6 3}, 
// 分 别 指定 2 号 元 到 中 的 若干 元 素 进 和 台 化 


[2][0] = { 10, 11, 12, 13 ] i = 14, 15 
}; 
printf("c[1][1][9] = %d，c[1][1][3] = %d，c[2][1][2] = %d\n", 
c[i][il[6]，c[i][1i][3]，c[2][1][2] ); 
// 声明 一 个 二 维 数组 对 象 d， 且 不 对 它 进行 直接 初始 化 
int d[3][4]; 


// 将 a[1] 中 二 维 数组 对 象 的 元 素 内 容 拷贝 到 二 
memcpy(d, a[1], sizeof(d)); 


A 


售 数 组 对 象 d 中 


printf("d[9][6] = %d，d[1][1] = %d，d[2][2] = %d\n", 
d[9][9]，d[L1][1]，d[2][2])， 


代码 清单 7-4 展 示 了 三 维 数组 的 声明 、 初 始 化 以 及 对 其 元 素 的 访 
问 。 通 过 以 上 这 些 例子 各 位 应 该 能 很 容易 地 总 结 出 来 : 二 维 数组 的 每 
个 元 素 是 一 个 一 维 数组 对 象 ， 三 维 数组 的 每 个 元 素 是 一 个 二 维 数组 对 
象 ， 那 么 N 维 数组 的 每 个 元 素 则 是 一 个 N-1 维 数组 对 象 。 


7.3 ” 变 长 数组 


我 们 在 7.1 节 与 7.2 节 中 描述 的 数组 都 是 固定 长 度 的 数组 。C99 标 准 
引入 了 一 种 叫 可 变 长 度 的 数组 (variable length array) ， 这 类 数组 在 声 
明 时 ， 其 元 素 个 数 不 是 用 常量 表达 式 来 指定 的 ， 而 是 通过 变量 。 因 此 
变 长 数组 不 能 在 文件 作用 域 中 声明 ， 不 能 用 static 存 储 类 说 明 符 来 修 
饰 。 此 外 ， 变 长 数组 以 及 指向 变 长 数组 的 指针 类 型 统称 为 可 变 修改 类 
型 (variably modified type) 。 当 可 变 修改 类 型 作为 sizeof 的 操作 数 时 ， 
sizeof 操 作 符 的 结果 将 在 运行 时 计算 ， 并且 操作 数 所 产生 的 副作用 也 将 
会 体现 出 来 。 随 后 ， 变 长 数组 声明 之 后 不 能 直接 对 它 进行 初始 化 ， 我 
们 只 能 通过 memcpy 等 库 画 数 或 通过 直接 访问 其 元 聚 的 方式 对 该 数组 中 
的 指定 元 聚 进行 赋值 。 正 由 于 变 长 数组 不 能 直接 使 用 初始 化 闪 进 行 初 
始 化 列表 ， 所 以 不 存在 匿名 变 长 数组 对 象 ， 即 变 长 数组 的 复合 字面 
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里 ” 


变 长 数组 在 有 些 场合 还 是 比较 实用 的 。 比 如 说 ， 我 们 要 在 一 个 男 
数 内 部 定义 一 个 数组 ， 但 其 大 小 需要 通过 函数 参数 来 指定 ， 且 元 素 个 
数 也 不 会 太 多 。 此 时 ， 如 采 随 便 定义 一 个 比较 大 的 数组 也 会 造成 栈 空 
间 的 不 必要 的 痕 费 ， 而 使 用 变 长 数组 则 正好 能 满足 需求 。 


代码 和 请 单 7-5 描 述 了 变 长 数组 的 一 些 使 用 方式 以 及 特性 。 


代码 清单 7-5” 变 长 数组 


#include <stdio.h> 


int main(int argc, const char * argv[]) 


{ 


| 。 


int a = 5; 

// 声明 了 一 个 含有 a 个 元 素 的 变 长 数组 对 象 b， 类 型 为 int[a]， 

// 这 里 不 能 对 数组 对 象 b 直 接 做 初始 化 

int bl[lal]; 

// 我 们 这 里 先 将 a 做 增 1 操 作 ， 此 时 a 变 为 6 

a++， 

// 其 全 生生 目的 全、 这 里 sizeof(b ) 就 可 能 不 是 在 编译 时 得 出 的 ， 而 是 在 运行 时 计算 得 至 
// 尽管 变量 a 增 加 了 1， 但 此 时 b 的 大 小 仍 为 20 个 字 节 ， 说 明 一 共 含有 5 个 Int 类 型 的 元 素 。 
// 说 中 数组 8 的 匹 直 在 基 明 的 于 全 蓉 名 摊 靖 号 采 下 灾 

printf("b Size is: %zu\n", sizeof(b)); 

int x = 0; 

// 声明 一 个 指 etn p 是 一 个 可 变 修改 类 型 的 指针 对 象 。 

// 指针 p 指 向 数组 b 的 地 址 。 这 里 要 是 ， 

// 由 于 a 的 值 已 经 被 修改 过 了 (V5 增加 到 了 6) ; 

// 所 以 ， 这 里 (*p) 的 类 型 虽然 仍然 为 jnt [a]， 但 int [a] 显 然 具有 6 个 int 类 型 的 元 素 
int (*p)[a] = = &b; 

// 这 里 ，(*p ) 的 大 小 为 int[a] 的 大 小 ， 计 算得 到 24 个 字 节 

printf("p[0] size is: %zu\n", sizeof(p[++x])); 

// 这 里 ，x 的 值 为 1， 说 明 sizeof 操 作 数 中 产生 ++X 的 副作用 

// 这 里 sizeof 的 计算 是 在 运行 时 得 到 结果 的 ， 而 不 是 在 编译 时 

printf("x = %d\n", x); 

// 如 果 在 变量 前 加 了 一 个 const 修 饰 ， 则 说 明 它 是 一 个 常量 

const int n = 10; 

// 这 里 一 维 数 组 对 象 d 就 不 是 一 个 变 长 数组 ， 而 是 一 个 定 长 数组 

// 尽管 这 里 数组 元 素 个 数 用 n 来 指定 ， “过 d 的 类 型 可 以 看 作为 int [10]， 而 不 是 int[n] 
int d[n] = { 1, 2, 3 }; 

// 这 里 用 常量 n 定 义 了 一 个 指向 数组 的 指针 对 象 qg， 

// 不 过 ， 这 里 的 q 不 是 个 可 变 修改 类 型 ，(* q) 的 类 型 为 int[10] 

int (*q)[n] = &d; 

// 这 里 的 ++x 不 产生 任何 副作用 ， 因 为 (*q) 不 是 一 个 变 长 数组 类 型 

printf("q[0] size is: %ZUNnn ， eto 

// x 的 值 仍然 为 1 

printf("x = %d\n", x); 

// 大 家 要 注意 的 是 ， 只 当 Sizeof 操 作 数 关 型 为 可 变 修改 类 型 时 ， 计 算 才 会 在 运行 时 执行 ， 
// 否则 的 话 ， 仍 然 在 编译 时 就 能 获得 结 : 直人 生 副 作用 。 

// 比如 这 里 局 一 个 长 数组 关 弄 nt [a] 但 b[++x] 的 类 型 为 int ， 

// 不 是 一 个 可 变 修改 类 型 ， 所 以 这 里 的 sizeof 仍 然 在 编译 时 得 到 结果 ， 且 ++x 不 产生 副作用 
printf("b[0] size is: %zu\n", sizeof(b[++x])); 


// x 的 值 仍然 为 1 
printf("x = %d\n", x); 


代码 清单 7-5 展 示 了 变 长 数组 的 一 些 基本 特性 ， 同 时 还 涉及 了 本 章 
稍 后 将 会 介绍 的 指针 相关 的 话题 。 为 了 说 明 可 变 修改 类 型 作为 sizeof 操 
作 数 时 的 运行 时 特性 ， 以 及 操作 数 产 生 的 副作用 的 特性 ， 所 以 这 里 先 
昔 用 一 下 。 此 外 ， 还 谈 到 了 用 const 限 定 符 来 修饰 对 象 的 情况 ， 此 时 该 


对 象 也 作为 一 个 党 量 而 不 是 变量 。const 限 定 符 将 在 12.1T 中 介绍 。 


7.4 一 级 指针 与 对 象 地 址 


从 本 节 开 始 ， 我 们 将 正式 涉及 C 语 言 中 的 一 个 核心 概念 一 一 指针 
(pointer) 的 话题 。 在 前 面 一 些 章 世 中 ， 为 了 表达 C 语 言 的 某 些 语法 符 
性 已 经 引入 了 关于 指针 的 一 些 表 达 形 式 。 各 位 在 看 完整 个 第 7 章 后 ， 回 
头 去 看 那些 内 容 将 会 有 更 为 深刻 的 理解 。 现 在 市 面 上 有 不 少 高 级 语言 
都 宣称 握 弃 了 “指针 ”这 个 概念 ， 但 实际 上 还 能 看 到 其 中 的 一 些 影子 。 
比如 Java 中 ， 虽 说 没有 直接 引入 指针 语法 系统 ， 但 它 里 面 涉及 到 的 引用 
(reference) 本 质 上 仍然 是 一 个 指针 ， 只 不 过 Java 没 有 引入 直接 取 其 内 
容 或 取 某 个 对 象 地 址 的 方式 ， 所 以 在 Java 中 你 也 无 法 取 一 个 引用 的 地 
址 。 而 在 C 语 言 中 ， 只 要 是 一 个 对 象 (对 象 都 拥有 自己 的 存储 地 址 ) ， 
那么 殴 能 取 其 地 址 。 


7.4.1 地址 与 指针 的 基本 概念 


要 解释 指针 这 个 概念 ， 我 们 先 说 地 址 (address) 。 在 C 语 言 中 ,无 
论 我 们 是 在 文件 作用 域 声明 一 个 对 象 ， 还 是 在 语句 块 作用 域 声明 一 个 
对 象 ， 它 们 都 具有 自己 的 地 址 。 比 如 ， 我 们 在 main 函 数 中 声明 了 一 个 
对 象 : int a=10;，， 那 么 对 象 a 丈 有 它 目 己 的 地 址 。 我 们 通过 单 目 操作 符 
& 来 取 对 象 a 的 地 址 一 一 &a。 这 里 的 & 操 作 符 在 C 语 言 标准 中 也 称 为 地 


址 操作 符 (address operators) ， 它 是 一 个 单 目前 绥 操 作 符 ， 跟 在 它 后 
面 的 表达 式 作 为 其 操作 数 。 一 个 对 象 的 地 址 长 度 根据 不 同 的 系统 环境 
会 有 所 不 同 。 比 如 ， 通 常 在 32 位 处 理 器 系统 模式 下 ， 地 址 的 长 度 为 4 个 
字 节 ;在 64 位 处 理 器 系统 模式 下， 地 址 的 长 度 为 8 个 字 节 。 一 个 地 址 表 
征 了 用 于 存放 一 个 对 象 的 数据 内 容 的 位 置 。 当 然 ， 现 代 处 理 右 基本 都 
有 一 套 内 存 管理 系统 ， 所 以 我 们 在 应 用 程序 中 拿 到 的 都 是 虚拟 地 址 ; 
而 在 一 些 简 单 的 藤 入 式 系统 下 ， 如 采 没 有 引入 虚拟 地 址 特性 ， 那 么 获 
取 到 的 对 象 地 址 就 是 物理 地 址 。 本 书 暂 时 不 考虑 对 象 所 在 的 古 虚 拟 地 
址 还 古物 理 地 址 ， 我 们 将 它们 都 抽象 为 “地 址 ”。 


有 了 地 址 之 后 ， 我 们 如 何 把 对 象 的 地 址 保存 起 来 以 便 后 续 使 用 
呢 ? 这 个 时 候 ，C 语 言 束 引 入 了 一 个 称 为 指针 的 类 型 类 别 。 一 个 指 网 int 
类 型 对 象 的 指针 就 能 存放 int 类 型 对 象 的 地 址 。 我 们 在 声明 一 个 对 象 
时 ， 在 对 象 标识 符 前 添加 * 号 束 能 把 它 声 明 为 一 个 指针 对 象 。 比 如 ， 要 
声明 一 个 指向 int 类 型 对 象 的 指针 对 象 p， 束 用 “int*p; ”。 这 里 ，* 可 以 
紧 贴 int 和 p， 像 “inttp; ”这 也 完全 没 问 题 。 不 过 在 习惯 上 ， 我 们 往往 会 
将 * 与 对 象 标识 符 紧 贴 ， 而 在 表示 一 个 类 型 时 ， 会 与 类 型 标识 符 紧 贴 。 
比如 : “int*p; sizeof (int*) ; ”等 。 指 向 一 个 普通 非 指针 对 象 的 指针 
叉 补 称 为 一 级 指针 。 代 码 清 单 7-6 搬 述 了 一 级 指针 对 象 的 声明 、 初 始 化 
以 及 使 用 。 


代码 清单 7-6 一 级 指针 的 基本 使 用 


#include <stdio.h> 
int main(int argc, const char * argv[]) 


// 声明 了 一 个 int 类 型 对 象 a， 并 给 它 初始 化 为 19 
int a = 10; 


// 声明 了 一 个 指向 int 类 型 的 指针 对 象 p， 类 型 为 in 

// 并 用 对 象 a 的 地 址 对 它 初始 化 ， 此 时 ， 振 竺 p 的 轩 庆 是 对 旬 a 的 地 址 。 
// 这 也 被 称 为 “指针 p 指 向 对 象 a” 

int *p = &a; 


// 一 个 指针 对 象 可 以 转 为 一 个 无 符号 整数 类 型 来 观察 该 指针 对 象 的 值 。 

// 不 过 我 们 一 般 使 用 uintptr_t 类 型 来 表示 一 个 对 象 地 址 的 值 。 

// 这 里 其 实 就 是 输出 对 象 & 的 地址 直 

printf("p Value is: QOx%.16tX, size is: %zu\n" 
(uintptr_t)p, sizeof (py)); 


代码 清单 7-6 简 单 明 了 地 曾 述 了 如 何 声 明 一 个 指针 对 象 并 为 它 进 行 
初始 化 的 方法 ， 最 后 还 输出 了 指针 对 象 p 的 值 。 以 上 代码 通过 Apple 
LLVM 8.0 编 译 并 在 macOS 10.12 系 统 下 运行 ， 由 于 是 64 位 系统 环境 ， 所 
以 地 址 长 度 为 8 个 字 方 。 图 7-3 展 示 了 对 象 与 指针 对 象 p 的 存储 布局 。 
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图 7-3 ”对 和 象 与 指针 对 象 p 的 存储 布局 


图 7-3 所 展示 的 内 容 是 基于 代码 清单 7-6 的 运行 结果 。 最 后 打印 输出 
指针 对 象 p 的 值 ( 即 对 象 的 地 址 ) 为 0x00007FFF5FBFF80C， 并 且 对 象 
a 的 值 为 10。 在 图 7-3 上 我 们 能 看 到 ， 地 址 0x00007FFF5FBFF800 是 指针 
对 象 p 的 地 址 ， 而 它 的 内 容 正 是 0x00007FFF5FBFF80C (地 址 从 左 到 右 
依次 为 从 低地 址 到 高 地 址 ) ， 在 地 址 0x00007FFF5FBFF80C 处 的 内 容 为 
0A 000000 (用 十 六 进 制 表示 ) ， 即 十 进 制 数 10， 它 就 是 对 象 的 值 。 
所 以 通过 这 个 图 我 们 能 清晰 地 认识 到 ， 指 针对 象 本 身 也 有 它 自己 的 地 


址 〈 这 里 的 0x00007FFF5FBFF800 就 是 指针 对 象 p 的 地 址 ) ， 而 指针 对 
象 的 值 就 是 它 所 指向 的 那个 对 象 的 地 址 〈 这 里 p 的 值 就 是 它 所 指向 的 对 
象 a 的 地 址 0x00007FFF5FBFF80C) 。 


7.4.2 访问 指针 对 象 所 指 对 象 的 内 容 


当 一 个 指针 对 象 指向 了 某 一 对 象 之 后 ， 我 们 就 可 以 使 用 间接 操作 
符 (indirection operator) 通过 指针 对 象 则 接地 访问 它 所 指向 对 象 的 
值 。 则 接 操 作 符 也 是 x*， 属 于 单 目前 弧 操 作 符 ， 跟 在 它 后 面 的 表达 式 作 
为 其 操作 数 。 它 与 用 来 声明 指针 类 别 对 象 的 * 不 属于 同 种 功能 。 间 接 操 
作 符 只 能 作用 于 指针 类 型 的 对 象 ， 也 就 是 说 间接 操作 符 的 操作 数 必 须 
是 一 个 指针 类 型 的 对 象 。 代 码 清单 7-7 简 单 介绍 了 间接 操作 符 的 使 用 以 
及 效果 。 


代码 清单 7-7 ”间接 操作 符 的 使 用 及 效果 


#include <stdio.h> 


int main(int argc, const char * argv[]) 
{ 


// 声明 了 一 个 int 类 型 对 象 8， 并 给 它 初始 化 为 10 
/ 


int a = 10 
// 声明 了 一 个 指向 int 类 型 的 指针 对 象 p， 类 型 为 jnt*; 
/7 有 对 象 4 的 地 址 对 它 初始 化 。 其 中 ，&a 表 达 式 的 类 型 也 是 int* 


| 用 
Int *p = &a; 
| 


门 通 过 间接 操作 符 对 指针 p 进 行 操作 ， 所 以 这 里 p 就 是 间接 操作 符 * 的 操作 数 ， 
// (*p) 的 类 型 为 int。 这 里 将 指针 p 所 指 的 内 容 修改 为 29 
多 20 


// 然后 我 们 可 以 观察 到 ， 对 象 a 的 值 变 为 了 20 
printf("a = %d\n", a); 


// 声明 了 一 个 short 类 型 对 象 b， p 上 所 指 的 对 象 的 值 对 它 进 行 初始 化 
Short b = *p; 


printf("b = %d\n", b); 


运行 代码 清单 7-7 之 后 ， 我 们 就 能 神奇 地 发 现 ， 当 执行 

了 *“*p=20; ”这 条 语句 之 后 ， 对 象 的 值 被 修改 为 20 了 。 这 是 怎么 发 生 
的 呢 ? 这 就 是 间接 操作 符 的 神奇 之 处 ! 我 们 可 以 借助 图 7-3 来 分 析 。 指 
针对 象 p 所 在 地 址 为 0x00007FFF5FBFF800， 它 的 值 就 是 对 象 的 地 址 

0x00007FFF5FBFF80C。 而 当 对 指针 对 象 p 动 用 了 间接 操作 ， 所 访问 的 
就 是 以 指针 对 象 p 的 值 (0x00007FFF5FBFF80C) 作为 地 址 ， 然 后 获取 
该 地 址 中 的 内 容 。“*p=20; ”这 条 语句 其 实 做 了 两 步 操作 : 首先 获得 指 
针对 象 p 的 值 ， 然 后 以 这 个 值 作为 地 址 ， 把 20 写 入 到 这 个 地 址 中 去 。 这 
样 地 址 0x00007FFF5FBFF80C (也 就 是 对 象 的 地 址 ) 的 内 容 由 原本 的 
10 变 为 了 20。 而 后 面 的 “short b=*p; ”也 是 同样 ， 先 获得 指针 p 的 值 ， 然 
后 以 该 值 作为 地 址 取 该 地 址 中 的 内 容 ， 将 该 数据 赋值 给 对 象 b。 


因此 ， 上 所谓 的 间接 操作 其 实 融 是 以 操作 数 的 值 作 为 地 址 ， 然 后 访 
问 该 地 址 的 内 容 。 这 与 取 对 象 地址 正好 是 一 个 逆 操 作 。 


7.4.3 ”指针 对 象 的 其 他 操作 


在 C 语 言 中 ， 两 个 指针 对 象 可 以 进行 大 小 比较 ， 也 就 是 比较 它们 所 
指向 对 象 的 地 址 大 小 ， 比 如 0x00007FFF5FBFF800 要 小 于 


0x00007FFF5FBFF80C， 所 以 代码 清单 7-6 中 的 指针 对 象 p 的 地 址 要 小 于 
对 象 的 地 址 。 而 指向 不 同类 型 的 指针 之 间 的 转换 通常 来 说 不 能 做 隐 式 
转换 。 我 们 在 第 5 章 讲解 整数 之 间 的 类 型 转换 时 谈 到 ， 在 C 语 言 中 高 精 
度 与 低 精度 整数 相互 转换 都 可 以 隐 式 执行 ， 不 需要 通过 投射 操作 显 式 
给 出 。 指 针 类 型 则 不 然 ， 一 个 int* 类 型 与 short* 类 型 之 间 就 无 法 进行 隐 
式 转换 ， 必 须 通 过 投射 操作 进行 显 式 转换 ， 否 则 会 有 编译 警告 。 


本 太一 开始 谈 到 了 对 象 的 地 址 。 一 个 对 象 在 C 语 言 中 通常 古 一 个 左 
值 (value) ， 而 对 于 一 个 右 值 (rvalue) 是 无 法 取 它 地 址 的 。C 语 言 标 
准 对 右 值 给 出 的 定义 古 : 一 个 表达 式 的 值 。 比 如 ， 一 个 sizeof 操 作 符 返 
回 的 值 、 一 个 整数 字面 量 、 对 一 个 对 象 做 取 地 址 操作 的 表达 式 ， 还 有 
++、-- 等 表达 式 。 不 过 当 以 上 这 些 表达 式 通 过 某 种 形式 僚 上 了 间接 操作 
符 之 后 ， 束 又 能 使 用 & 进 行 取 地 址 操作 了 “。 但 此 时 ，& 取 地 址 操作 符 的 
语义 其 实 不 是 取 它 表达 式 的 地 址 ， 而 是 用 于 脱 去 间接 操作 的 效果 。 代 
码 清单 7-8 将 会 清 苞 地 给 大 家 摘 述 以 上 这 些 内 容 的 实际 效 末 。 


代码 清单 7-8 ”指针 与 取 地 址 的 其 他 特性 


#include <stdio.h> 
#include <stdbool.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 


// 声明 了 两 个 int32_ 0 分 别 为 a 和 b 
int32 t a = 10, b = 


// 声明 了 三 个 指向 int32_ t 闫 型 的 指针 对 象 ， 分 别 为 p、q 和 r。 
// 注意 ， 这 里 用 逗号 分 隔 的 声明 符 列表 ,各 果 要 指明 是 指针 类 型 ， 
// 那么 每 个 指针 对 荣 标 识 符 前 都 必须 深 加 、 

// 对 象 c 是 一 个 int32_ t 类 型 的 对 象 

Int32 t *p = &a, *q = &b, c = 0, *r = &c,; 


// 指针 可 以 进行 比较 大 小 以 及 判断 是 售 相 等 
bool e=p>d' 
printf("Is p > q? %d\n", e); 


p = 
printrC"rs p equal to r? %d\n", e); 


// 比较 r 是 否 与 对 象 e 的 地 址 相同 
printf("Is r equal to &c? %d\n", r == &c); 


// 声明 了 一 个 int16 _t 类 型 对 象 s 以 及 一 个 指向 int16_ t 类 型 的 指针 对 象 t 
int16 t s = 1, *t = &s; 


// 以 下 这 句 会 出 现 编译 警告 ， 因 为 jnt32_t* 类 型 与 nt16_t* 类 型 不 匹配 


// 以 下 这 句 也 会 出 现 警告 ， 因 为 int16_t* 类 型 与 int32_t* 类 型 不 匹配 

r = &s; 

// 如 果 要 用 指针 t 指 向 对 象 a， 那 么 可 以 使 和 
= (int16_t*)e&a; // 这 里 不 会 有 编译 


*t = 2048; ”// 通过 指针 t 将 对 象 a 的 值 间 接地 修改 为 2048 


// 尽管 可 “会 出 现 编译 警告 ， 但 不 建议 这 么 做 ! 

于 对 象 s 是 int16_t 类 型 ， 宽 度 p 所 指向 的 int32_ t 类 型 的 宽度 大 ， 
< 尚 若 通过 指针 p 与 和 了 一 个 闻 出 int16 t 类 型 能 表示 范围 的 值 ， 那 可 能 引发 无 法 预料 的 事 
= (int32_t* 过， 


天 


*p = 1024; // 这 里 不 会 有 任何 问题 ， 因 为 1024 在 int16_t 类 型 可 表示 的 范 车 


内 


而 


printf("a = %d, s = %d\n", a, Ss); 


// 以 下 这 些 表达 式 都 是 错误 的 ， 都 将 引发 编译 报错 
&b+t++; &++b; &1234; &sizeof(b); &&a; 


// 不 过 一 个 匿名 数组 、 匿 名 结构 体 等 表达 式 可 以 进行 取 地 址 操作 加 
int32 t (*pa)[3] = &(int32_t[]){1i1，2，3};  // pa 是 指向 一 个 匿名 数组 的 指针 


struct S { int32_t a, b; }; 
struct S *ps = &(struct S){10，20}; // ps 是 指向 一 个 匿名 结构 体 的 指针 


// 以 下 表达 式 都 是 有 效 的 ， 并 且 取 地 址 与 间接 操作 相互 抵消 
&*p++; &*++q;  ”// 效果 如 同 与 : p++; ++q; 
p = &*r; // 效果 如 同 与 : p = r; 
printf("*p = %d\n", *p); 


a = 10; 


// 取 地 址 操作 符 与 间接 操作 符 允 许多 次 帜 套 ， 尽 管 这 看 上 去 比较 繁复 
b = *&*&*&a; // 这 人 句 等 同 于 : b = a; 


printf("b = %d\n", b); 


// 重新 让 指针 对 象 p 指 
p = &a; 


// 指针 与 整数 之 间 也 可 以 通过 投射 操作 来 相互 转换 。 

// 之 前 已 经 提 到 过 ， 用 于 存放 指针 值 或 地 ne 

// 或 uintptr_t。 这 里 ， address 的 值 就 是 指针 pg 的 什 妈 对 角 本 地址 值 。 | 
// 这 里 通过 投射 操作 将 指向 int32_t 类 型 的 指针 类 型 转换 为 uintptr_ t 整 数 类 型 
uintptr_t address = (uintptr_t)p; 


// 这 里 声明 了 一 个 指向 int32_t 类 型 的 指针 对 象 p2， 

// 然后 直接 将 address 的 值 对 它 进行 初始 化 。 ， 
// 这 里 通过 投射 操作 将 address 的 类 型 转换 为 一 个 指向 int32_t 的 指针 类 型 
int32 t *p2 = (int32 _t*)address; 


I 


对 稼 a 


+ 


ea 


printf("*p2 = %d\n", *p2); 


代码 清单 7-8 给 大 家 介绍 了 声明 指针 对 象 时 的 注意 事项 ， 其 中 大 家 
必须 要 注意 ， 指 针 说 明 符 * 一 般 是 紧 跟 对 象 标识 符 的 ， 而 不 是 类 型 名 。 
指针 之 间 可 以 比较 大 小 以 及 判别 是 否 相 等 。 取 地 址 操作 符 的 操作 数 一 
般 不 能 古 一 个 右 值 。 对 于 上 毗邻 的 间接 操作 符 与 取 地 址 符 ， 它 们 的 作用 
将 会 相互 抵消 。 一 个 指针 类 型 可 以 通过 投 册 操 作 而 转换 为 一 个 整 型 ; 
同样 ， 一 个 整 型 也 可 以 通过 投射 操作 转换 为 一 个 指针 类 型 。 


以 上 这 些 就 是 关于 一 个 指针 对 象 的 基本 概念 和 作用 。 这 里 大 家 要 
理解 ， 一 个 指针 对 象 本 身 也 是 个 对 象 ， 它 也 有 地 址 ， 而 它 的 值 则 是 它 
所 指向 的 一 个 对 象 的 地 址 。 不 过 ， 我 们 可 以 通过 投射 操作 直接 给 一 个 
指针 对 象 赋值 为 一 个 具体 指定 的 地 址 值 ， 比 如 “int*p= (int*) 
0x00FF0100; ”。 这里， 指针 对 象 p 束 指向 地 址 0x00FF0100。 当 然 ， 这 
么 做 之 前 我 们 必须 要 清楚 0x00FF0100 这 个 地 址 是 否 合 法 ， 并 且 当 前 是 
否 能 安全 地 访问 存放 在 该 地 址 里 的 数据 内 容 。 


7.5 多 级 指针 


圭一 市 介绍 了 一 个 一 级 指针 的 基本 概念 和 各 种 特性 ， 并 且 提 到 了 
一 个 指针 对 象 本 号 也 有 地 址 。 那 么 我 们 会 有 疑问 ， 我 们 应 该 如 何 用 一 
个 指针 对 象 去 指向 另 一 个 指针 对 象 的 地 址 呢 ? 此 时 ， 我 们 将 引入 多 级 
指针 这 一 概念 。 


如 采 我 们 要 指 回 一 个 一 级 指针 对 象 的 地 址 ， 比 如 : “intsp; ”。 此 
时 如 果 要 指 回 p 的 地 址 一 一 &p， 那 么 我 们 就 需要 一 个 二 级 指针 对 象 ， 比 
如 : “int**q=&p; ”。 这 里 ，q 殉 是 指 癌 一 级 指针 对 象 p 的 一 个 二 级 指 
针 ， 其 类 型 为 intt+*， 表 示 指 向 一 个 〈 指 向 一 个 int 类 型 的 ) 指针 的 指 
针 。 我 们 通过 代码 清单 7-9 来 进一步 观察 二 级 指针 、 一 级 指针 以 及 普通 
对 和 象 之 间 的 关系 。 


代码 清单 7-9 ”多 级 指针 概貌 


#include <stdio.h> 
#include <stdbool.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 


// 声明 了 一 个 jnt32_t 对 象 x 和 对 象 y 
int32_t x = 10, y = 20; 


// 声明 了 一 个 指向 int32_t 类 型 的 指针 对 象 p 和 q， 
// 分 员 将 对 象 x 的 地 址 与 | 象 y 的 地 址 对 它们 初始 化 
Int32 t *p = &x, *q = &y; 


// 声明 了 一 个 指向 int32_t 指 针对 象 的 指针 对 象 pp， 
// 对 象 p 的 地 址 对 它 初始 化 
int32_t **pp = &p; 
门 可 以 用 间接 操作 符 来 取 pp 的 内 容 


~ 
~ 

地 
五 


// 这 里 ， 即 对 象 x 的 地 址 
bool b = 
printf("b = hn “pb)， 


// 修改 pp 的 内 容 ， 将 它 修改 为 指针 对 象 q 的 值 ; 
// 这 实际 上 是 就 是 将 指针 对 系 p 的 值 修改 成 q 的 值 ， 即 对 象 y 的 地 址 
“pp = 9q; 


printf("p == q? %d\n", p == q); 

// 这 里 用 了 两 次 间接 操作 符 ， 第 一 次 同样 是 访问 pp 所 指 对 象 地 址 的 内 容 ， 
// 即 指针 对 象 q 的 值 。 第 二 次 则 是 以 q 的 值 作为 地 址 ， 访 问 其 内 容 。 

// 于 q 指 向 的 是 y， 所 以 这 步 操作 直接 将 对 象 y 的 值 修 改 为 了 30 


**pp = 30; 
printf("y = %d\n", y); 


下 面 我 们 根据 代码 清单 7-9 中 的 示例 来 讲解 这 段 代码 通过 Apple 
LLVM 8.0 构 建 后 ， 在 macOS 10.12.4 下 运行 时 的 情况 。 其 中 主要 观察 指 
针对 和 象 pp、p、q 的 内 容 变 化 。 通 过 在 bool b=*pp==&x; 这 人 名 打上 上 断 点 
之 后 ， 这 5 个 对 象 的 存储 位 置 如 图 7-4 所 示 。 


图 7-4 ”执行 到 第 4 句 时 的 存储 器 内 容 


图 7-4 中 ，pp 对 象 的 地 址 为 00007F FF 5F BF F7 F0 (此 图 中 看 最 上 
面 ，CDemo 的 右边 那 一 串 文 字 ) 。 我 们 很 容易 发 现 对 象 y 的 内 容 及 其 地 
址 ， 只 要 查找 到 十 六 进 制 数 14 就 是 y 的 内 容 数值 ， 而 它 的 地 址 为 00007F 
FF 5F BF F808， 对 象 x 的 内 容 只 要 查找 到 十 六 进 制 数 0A 即 可 ， 其 地 址 
为 00007F FF 5F BF F80C。 然 后 根据 对 象 x 的 地 址 来 查找 指针 对 象 p 的 地 
址 ， 可 以 看 到 是 00007F FF 5F BF F800; 根据 对 象 y 的 地 址 找到 指针 对 
象 q 的 地 址 一 00007F FF 5F BF F7 F8。 这 样 ， 我 们 已 经 清晰 地 看 到 指 
针对 象 pp 的 内 容 了 ， 正 是 指针 对 象 p 的 地 址 值 ! 当 我 们 对 指针 对 象 pp 做 


一 次 间接 操作 ， 那 么 其 实 就 是 访问 它 所 指 指针 对 象 的 值 ， 即 p 的 值 。 所 
以 ， 我 们 通过 *pp 与 x 的 地 址 进行 比较 能 获得 两 者 相等 的 结果 。 从 类 型 
上 讲 ，pp 是 int** 类 型 ， 那 么 *pp 束 是 int* 类 型 了 了，**pp 则 是 int 类 型 。 


之 后 ， 我 们 对 *pp 进 行 修改 ， 将 q 的 值 赋值 给 *pp， 这 样 其 实 束 是 将 
指针 对 象 p 的 值 间接 修改 成 了 q 的 值 。 我 们 看 图 7-5 所 示 的 变化 。 


娩 j|《 | 团 CDemo ) 六 Ox7fff5fbff7f0 


7FFF5FBFF7FQ 00 F8 BF SF FF 7F 00 00 08 F8 BF SF FF 7F 00 00 68 F8 BF SF FF 7F 680 00 14 80 900 90 0A 00 00 60 


图 7-5 ”*pp 修 改 之 后 的 内 容 变 化 


我 们 看 到 ， 图 7-5 中 ， 对 象 p 地 址 (00007F FF 5F BF F800) 的 内 容 
发 生 了 改变 ， 由 原来 的 00007F FF 5F BF F80C (对 象 x 的 地 址 ) 变 为 了 
00007F FF 5F BF F808 (对 象 y 的 地 址 ) 。 所 以 ，*pp 的 操作 就 是 将 pp 对 
象 的 值 (00007F FF 5F BF F800， 即 对 象 p 的 地 址 ) 作为 地 址 ， 然 后 访 
问 其 内 容 (在 赋值 前 得 到 00007F FF 5F BF F80C， 即 对 象 x 的 地 址 ) 。 
这 里 的 赋值 操作 其 实 就 是 将 gq 的 值 〈 即 地 址 00007F FF 5F BF F7 F8 所 包 
含 的 内 容 ) 写 入 到 00007F FF 5F BF F800 地 址 中 去 。 这 样 就 间接 实现 了 
将 指针 对 和 象 q 的 值 赋值 给 了 指针 对 象 p， 使 得 指针 p 也 指向 了 对 和 象 y 的 地 
址 。 


最 后 **pp 其 实 就 是 先 对 pp 做 一 次 间接 操作 ， 将 pp 地 址 的 内 容 作为 
地 址 ， 访 问 其 内 容 ; 然后 以 该 内 容 ， 即 (*pp) 的 值 作为 地 址 ， 再 访问 
一 次 内 容 。 最 终 获 得 的 就 是 对 象 y 的 值 。“**pp=30; ”其 实 就 是 将 30 写 


入 到 对 象 y 的 地 址 中 去 ， 使 得 此 双重 间接 操作 间接 地 修改 了 对 象 y 的 
值 。 下 面 我 们 可 以 用 一 段 C 语 言 程序 更 深入 地 解释 一 下 “**pp=30; ” 执 
行 的 过 程 。 


代码 清单 7-10”**pp=30; 的 执行 过 程 分 解 


#include <stdio.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 
Int32 t a = 10; 


int32_t *p = &a; 
int32_t **pp = &p; 


// 下 面 钙 执行 的 分 解 动作 
// 第 一 步 : 侈 次 遇 大 指 才 未 的 地 址 | address1 保 存 
uintptr_t address1 = (uintptr_t)pp; 


/ 第 二 步 : 以 address1 作 为 地 址 ， 再 访问 其 内 容 
0 然后 将 此 内 容 保存 为 address2。 这 一 步 相当 于 执行 了 第 一 次 间接 操作 
uintptr_t address2 = *(uUintptr_t*)address1， 


// 第 三 步 : 最 后 以 address2 作 为 地 址 ， 将 30 写 入 其 中 。 
// 这 一 步 相 当 于 执行 了 第 二 次 间接 操作 
*(int32_t*)address2 = 30,; 


// 最 后 可 以 看 到 a 的 值 被 修改 为 39 
printf("a = %d\n", a); 


代码 清单 7-10 更 直观 地 解释 了 两 次 间接 操作 的 整个 过 程 。 通 过 这 个 
例子 ， 大 家 对 于 间接 操作 的 理解 应 该 更 为 深入 了 吧 。 最 后 跟 大 家 再 总 
结 一 下 : 在 声明 一 个 指针 对 象 时 ，* 号 表示 该 对 象 为 多 少 级 的 指针 对 
象 ， 在 表达 式 中 ，* 号 作为 单 目 操作 符 使 用 时 就 是 间接 操作 ， 表 示 以 它 
的 操作 数 的 值 作为 地 址 ， 取 该 地 址 中 的 内 容 。 所 取 内 容 的 长 度 则 根据 
类 型 来 判定 ， 如 果 操 作 数 的 类 型 为 int32_t*， 那 么 取 int32_t 类 型 长 度 

( 即 32 位 ) 整数 ， 如 果 操 作 数 的 类 型 为 int32_t** 类 型 ， 那 么 取 int32_t* 


类 型 长 度 ( 即 一 个 地 址 长 度 ) 的 整数 ， 如 果 操 作 数 的 类 型 是 float*， 那 
么 取 float 类 型 ( 即 32 位 单 精 度 ) 浮 点 数 。 


我 们 下 面 用 图 7-6 来 展示 代码 清单 7-9 中 通过 pp 二 级 指针 对 象 间接 修 
改 指针 对 象 p 的 值 以 及 对 象 y 的 值 的 过 程 。 


(通过 *pp 修 改 前 ) 


pp 地 址 : 7F FF SF BF F7 F0 p 地 址 : 7F FF SF BF F8 00 x 地 址 : 7F FF SF BF F8 0C 
7F FF SF BF F8 00 硬 7F FF SF BF F8 0C 00 00 00 0A 


(通过 *pp 修 改 p 指 针对 象 的 值 之 后 ) 


pp 地 址 : 7F FF SF BF F7 F0 p 地 址 : 7F FF SF BF F8 00 y 地 址 : 7F FF SF BF F8 08 
7F FF SF BF F8 00 -Tr 7F FF SF BF F8 08 ] 00 00 00 14 | 


(通过 **pp 修 改 y 指 针对 象 的 值 之 后 ) 


pp 地 址 : 7F FF SF BF F7 F0 p 地 址 : 7F FF 5F BF F8 00 y 地 址 : 7F FF SF BF F8 08 
| 7F FF SF BF F8 00 Tr 7F FF SF BF F8 08 | 00 00 00 1E | 


图 7-6 ”通过 二 级 指针 对 象 pp 修改 p 指 针对 和 象 及 y 对 和 象 值 的 过 程 示意 


图 7-6 中 ， 和 矩形 上 方 的 文字 表示 当前 对 象 名 以 及 其 地 址 ， 和 矩形 中 的 
十 六 进 制 数 串 表示 当前 对 象 的 值 ， 箭 头 表 示 当 前 指针 对 象 指向 某 一 个 
对 象 。 


7.6” 指 回 用 户 目 定义 类 型 的 指针 


在 上 两 入 中 ， 我 们 基本 以 指向 整数 类 型 的 指针 作为 例子 。 其 实 除 
了 指 回 整数 、 浮 点 数 等 基本 类 型 的 指针 外 ， 我 们 还 能 定义 指 癌 枚 举 、 
结构 体 以 及 联合 体 类 型 的 指针 。 指 向 枚 举 类 型 的 指针 与 一 般 指 癌 基 本 
类 型 的 指针 差不多 ， 只 不 过 类 型 变 为 枚 举 类 型 而 已 。 对 于 结构 体 以 及 
联合 体 这 种 带 有 各 目 成 员 对 象 的 类 型 而 言 ， 这 里 会 涉及 如 何 用 一 个 指 
问 结 构 体 和 联合 体 类 型 的 指针 对 象 去 访问 它们 成 员 的 问题 。 我 们 在 6.2 
节 已 经 知道 ， 对 于 一 个 普通 的 结构 体 对 象 要 访问 其 成 员 时 ， 我 们 使 
用 “.” 操 作 符 。 而 如 琳 我 们 要 通过 一 个 指向 结构 体 类 型 的 指针 去 访问 它 
所 指 的 结构 体 对 象 的 成 员 时 ， 我 们 必须 使 用 “->” 成 员 访问 操作 符 。 


下 面 我 们 举 一 些 例 子 来 描述 指 癌 用 户 目 定义 类 型 的 指针 的 声明 以 
及 使 用 ， 请 见 代 码 清 单 7-11。 


代码 清单 7-11 ” 指 癌 用 户 目 定义 类 型 的 指针 


#include <stdio.h> 
int main(int argc, const char * argv[]) 


// 定义 一 个 名 为 TRAFFIC_LIGHT 的 枚 举 ， 并 包含 三 个 枚 举 值 
enum TRAFFIC_LIGHT 
{ 


TRAFFIC_LIGHT_RED， 
TRAFFIC_LIGHT_ YELLow， 
TRAFFIC_LIGHT_GREEN 
// 然后 ， 直 接 声 明 人 以 及 指向 该 枚 举 的 指针 对 象 pe， 
// 接 指 上 人 
} light, *pe = &ligh 


// 我 们 也 可 以 用 以 下 这 种 更 普遍 的 形式 声明 一 个 指向 枚 举 类 型 的 指针 对 象 


enum TRAFFIC_LIGHT *pe2 = pe; 


// 由 于 1ight 并 没有 初始 化 ， 所 以 它 的 值 是 不 确定 的 ， 这 里 
*pe2 = TRAFFIC_LIGHT_YELLOW; 


过 指针 给 它 赋值 


pur 


// 输出 1 
printf("light = %d\n", light); 


// 定义 一 个 名 为 S 的 结构 体 


struct S 


int a; 
float f; 
enum TRAFFIC_LIGHT *pe,; 


// 接 声明 一 个 对 象 s 以 及 指向 该 结构 体 类 型 的 指针 对 象 p 
}s, *p = &s; 


// 利用 指针 对 象 p 间 接 为 对 象 s 的 成 员 赋值 


-0' 5f; 
p->pe = &light; 


// 当然 ， 我 们 也 可 以 用 以 es _ 
// 日 是 我 们 需要 注 ; 莹 的 是 ， 里 必 \ 须 加 一 个 圆 括号 
// 因为 成 员 访问 操作 符 ^. “的 优先 级 高 司 搂 操 作 符 “*” 
(*p).a += 10; 

(*p).f -= 1.0f; 


// 将 成 员 指针 pe 所 指 的 枚 举 对 象 的 值 修改 为 TRAFFIC_LIGHT_GREEN， 
// *(*p) .pe 表达 式 相当 *((*p).pe) 
*(*p).pe = TRAFFIC_ LIGHT_， GREEN ; 


// 我 们 观察 对 象 s 的 成 员 ， 分 别 为 20 和 -1.5 和 2 
printf("a = %d, f = > light = %d\n", s.a, Ss.f, light); 


// 以 下 这 句 表 达 式 就 相当 于 *(p->pe)， 因 为 成 员 访 问 操作 符 “->” 的 优先 级 高 于 


*p->pe = TRAFFIC_LIGHT_RED; 


// 输出 9 
printf("light = %d\n", light); 


// 这 里 结构 体 S 声 明了 一 个 对 象 S2 *p 对 它 初始 化 。 
// 这 就 相当 于 是 用 对 和 象 s 对 s2 进 行 困 始 化 
struct S s2 = *p; 


iE 


// 输出 20，-1.5, 0 
printf("a = %d, f = %f, light = %d\n", s2.a, Ss2.f, *s2.pe); 


// 这 里 声明 了 一 个 指向 结构 体 S 的 二 级 指针 对 象 pp， jp 的 地 址 对 它 初 始 化 
struct S **pp = &p; 


// 我 们 只 能 通过 以 下 方式 来 访问 pp 的 成 员 
(*pp)->a -= 10; 

(**pp).f += 1.0f; 

*(*pp)->pe = TRAFFIC_LIGHT_YELLOW; 


// 输出 10，-0.5, 1 
printf("a = %d, f = %f, light = %d\n", s.a, Ss.f, light); 


间接 操作 符 “*” 


代码 清单 7-11 中 我 们 看 到 了 成 员 访 问 操作 符 的 优先 级 要 高 于 间接 
操作 符 的 优先 级 ， 所 以 我 们 在 刚 开始 写 代码 时 需要 注意 这 点 ， 以 免 搞 
关 了 逻辑 。 此 外 ， 对 于 指向 结构 体 或 联合 体 的 二 级 指针 对 象 ， 在 
C++ 中 也 能 直接 使 用 “->” 操 作 符 进行 成 员 访 问 (比如 代码 清单 7-11 中 声 
明 的 pp， 可 直接 用 “pp->a-=10; ”， 但 C 语 言 则 不 行 ， 这 点 对 于 学 过 
C++ 的 朋友 需要 格外 注意 。 


7.7 ”指针 与 数组 的 天 系 


我 们 之 前 已 经 提 到 过 ， 指 针对 象 与 数组 对 象 属 于 两 种 不 同 的 类 

别 ， 数 组 属于 聚合 类 型 ， 而 指针 属于 标量 类 型 。 但 有 趣 的 是 ， 一 个 数 
组 对 象 能 合法 地 隐 式 转 为 相应 的 指针 类 型 。 比 如 ， 一 个 int[5] 类 型 能 被 
转 为 int* 类 型 ， 使 得 一 个 指针 对 象 能 指向 一 个 数组 的 某 一 元 素 的 地 
址 。 而 在 C11 标 准 中 也 是 明文 指出 : 除了 当 数 组 对 象 标识 符 作 为 
sizeof、_Alignof、 单 目 & 操 作 符 的 操作 数 之 外 ， 表 示 数 组 类 型 的 表达 
式 会 被 转换 为 指向 该 数组 元 素 类 型 的 指针 类 型 ( 即 [type] 类 型 被 转换 为 
type* 类 型 ) ， 而 该 表达 式 的 值 则 指向 该 数组 对 象 的 初始 元 素 ， 并 且 不 
再 是 一 个 左 值 。 所 以 ， 我 们 通常 在 表达 式 中 引用 数组 对 象 标识 符 的 时 
候 ， 实 际 使 用 的 是 指向 该 数组 首 个 元 素 地 址 的 指针 ， 我 们 可 以 将 数组 
对 象 标识 符 作为 间接 操作 符 的 操作 数 。 另 外 ， 一 个 指针 对 象 也 能 通过 
使 用 下 标 操作 符 来 访问 它 所 指向 的 数组 缓存 中 的 相应 元 素 。 在 C 语 言 
标准 中 ， 其 实 是 将 下 标 操作 翻译 为 指针 与 整数 的 加 减法 操作 。 指 针 与 
整数 之 间 的 加 减法 操作 与 一 般 整 数 之 间 的 加 减法 有 所 不 同 ， 假 定 这 里 
声明 了 一 个 指针 对 象 p 为 type*p， 那 么 (p+1) 的 值 为 p+sizeof 

(type) ; (p+2) 的 值 为 ptsizeof (type) *2， 以 此 类 推 。C 语 言 可 以 
将 * (p+1) 写作 为 p[1]; 将 * (p+2) 写作 为 p[2]; 而 (*p) 就 相当 于 * 

(p+0) ， 可 写作 为 p[0]。 


同 理 ， 对 间接 操作 的 逆 操 作 一 一 取 地 址 操作 而 言 ， 对 于 一 个 一 维 
数组 ， 对 其 某 个 元 素 做 取 地 址 操作 就 相当 于 从 该 数组 首 地 址 加 上 指定 
元 素 所 在 的 偏 移 地 址 。 所 以 ， 像 (p+1) 与 &p[1] 是 等 同 的 。 这 里 大 家 
要 注意 的 是 ， 下 标 操作 符 属 于 后 级 操作 人 符 ， 其 计算 优先 级 要 高 于 单 日 
取 地 址 操作 符 &， 所 以 &p[1] 相 当 于 & (p[1]) 。 从 类 型 上 分 析 ，p 是 属 
于 type* 类 型 ， (p+1) 仍然 属于 type* 类 型 ， 而 p[1] 就 是 type 类 型 了 (由 
于 p[1] 相 当 于 * (p+1) ) 。 所 以 ， 对 p[1] 再 做 取 地 址 操作 就 好 比 &* 
(p+1) ， 根 据 我 们 在 7.4 市 最 后 所 提 到 的 ， 一 个 取 地 址 符 如 果 与 间接 
操作 符 两 者 毗邻 ， 则 相互 抵消 ， 所 以 可 直接 得 到 它 与 (p+1) 完全 等 
局 区 


代码 清单 7-12 比 较 详细 地 描述 了 指针 与 数组 之 间 的 转换 以 及 指针 
加 减 运 算 的 规则 与 特性 。 这 里 各 位 要 注意 的 是 ， 指 针对 象 只 能 用 加 法 
和 减法 对 它们 进行 算术 计算 ， 而 不 能 用 乘除 法 。 当 然 ， 两 个 指针 对 和 象 
之 间或 一 个 指针 与 一 个 整数 之 间 也 不 能 使 用 按 位 逻辑 运算 。 


代码 清单 7-12 ”指针 与 数组 的 天 系 及 算术 运 入 


#include <stdio.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 
// 声明 了 一 个 含有 5 个 int 类 型 元 素 的 数组 对 象 ， 并 对 它 初 始 化 
int32_ t a[5] = { 1, 2, 3, 4, 5 }; 
// 声明 了 一 个 指针 对 象 p， 数组 a 的 首 个 元 素 的 地 址 对 它 初始 化 
// 这 里 相当 于 : int32_t *p = &a[0]; 
Int32 t *p = a; 


t 
// 将 p 的 值 ， 即 数组 a 的 首 地 址 打印 出 来 
printf("a address: QOx%.16tX\n", p); 


printf("*p = %d\n", *p); 


// 上 述 对 p 的 初始 化 等 同 于 下 面 这 条 赋值 语句 a 
// 旧 于 数 红 索引 操作 符 [的 1 E 级 比 取 地 址 操作 符 & 要 高 ， 
// 所 以 这 里 p = &a[1]; 又 相当 于 p = &(a[1]); 

p = &a[1]; 


引 叶 六 


二 


// 这 里 *p 的 值 就 是 2， 即 a[1] 的 
printf("*p = %d\n", *p); 


// 将 p 的 值 打印 出 来 
printf("a[1] address: Ox%.16tX\n", p); 


// 声明 一 个 address 变 量 记录 当前 指针 对 象 p 的 值 
uintptr_t address = (uintptr_ t)p; 
p++; // 相当 于 p += 1; 此 时 ，p 指 向 了 数组 a[2] 元 素 的 地 址 


printf("p value: Ox%.16tX\n", p); 
printf("*p = %d\n", *p); 


// 上 面 的 p++ 就 好 比 : 
address += sizeof(*p); // *p 类 型 为 int32_t， 所 以 这 里 为 4 


// 这 里 address 与 p 的 值 相等 
printf("Is equal? %d\n", address == (uintptr_t)p); 


// 我 们 将 指针 对 象 p 重 新 指向 数组 a 的 起 始 地 址 

p= a; 

p[3] += 10; // 相当 于 *(p + 3) += 10 
*( 生 运 二 ， // 相当 于 p[4] -= 5 


printf("a[3] = %d，a[4] = %d\n", a[3], a[4]); 


/** 除了 指针 对 象 与 整数 对 象 之 间 ns A 个 指针 对 象 之 间 也 能 做 减法 计算 */ 
了 a + 1 与 &a[1] 是 等 价 的 ， 


// 这 里 让 指针 p 指 向 数组 a 的 1 号 元 素 。 这 里 Re 

// 说 明 这 里 的 数组 对 象 标 识 符 a 已 经 f 为 外 句 其 7 个 元 素 地 址 的 指针 类 型 

p = a+1; 

int32_t *q = &a[3]; // 这 里 声明 指针 对 象 9， 并 将 它 指 向 数组 a 的 3 号 元 素 


ptrdiff t diff =q -p; // 我 们 计算 q 革 bp 之 间 的 关 值 


// 我 们 可 以 观察 到 q 与 p 之 间 的 差 值 为 2， 说 明 两 者 跨 了 2 个 元 素 
printf("diff is: %td\n", diff); 


// 这 里 p 与 q 两 个 指针 之 间 的 计算 相当 于 : 
diff = (intptr_t)q - (intptr_t)p; 
diff /= sizeof(*p); 

printf("diff is: %td\n", diff); 


// 这 里 声明 了 一 个 数组 对 象 array， 其 类 型 为 int32_t* [5]， 

// 即 array 是 一 个 包含 5 个 元 素 的 数组 ， 其 每 个 元 素 的 类 型 为 int32_tx 。 
这 里 由 于 array y[3] 和 array[4] 没 有 被 显 式 初 始 化 ， 

// 因此 它们 被 默认 初始 化 为 空 

Int32_t* array[5] = { p, 9q, a }; 


// 由 于 当前 p 指 向 a[1] 地 址 ， 所 以 输出 : array[90][9] = 2 

// array[9][9] 相 当 于 array[9]， 我 们 也 可 以 用 **array。 

// **array 则 完全 可 以 体现 出 出 ， 当 数组 标识 符 用 于 表达 式 时 

// 它 就 相当 于 指向 它 首 个 元 素 地 址 的 指针 ， 因而 才能 作为 间接 操 作 符 的 操作 数 
printf("array[0][0] = %d\n", **array); 


// 这 里 相当 于 访问 指针 对 象 q 所 指 的 对 象 的 内 容 ， 输 
printf("*array[1] = %d\n", *array[1]); 


2 


出 : *array[1] = 


EY 


// 由 于 array[2] 的 值 即 为 数组 对 象 a 的 首 地 址 ， 

所 以 我 们 可 以 借助 array[2] 来 间接 访问 数组 a 的 元 素 。 
// 这 里 array[2] [4] 世 就 相当 于 a[4]， 输 出 : array[2][4] = 0 
pr a A = %d\n", array[2][4]); 

这 里 能 输出 0 


if (array[3] == NULL && array[4] == NULL) 
puts("OK!"); 


代码 清单 7-12 清 晰 地 描述 了 指针 与 数组 之 间 转 换 以 及 指针 的 算术 
运算 。 不 过 这 里 需要 再 度 提 醒 的 是 ， 尽 管 一 个 数组 类 型 作为 表达 式 时 
可 以 被 隐 式 地 转换 成 相应 的 指针 类 型 ， 但 数组 对 象 类 别 与 指针 对 和 象 类 
别 仍然 是 两 个 不 同 的 类 别 ， 而 像 int[5] 类 型 与 int* 类 型 也 属于 不 同 的 类 
型 。 此 外 ， 一 个 指针 类 型 无 法 被 转换 为 一 个 数组 类 型 ， 即 便 用 投射 操 
作 也 不 行 。 更 确切 地 说 ， 数 组 类 型 无 法 作为 一 个 投射 操作 符 的 操作 
数 ， 即 像 * (int[5]) p” 这 种 表达 式 是 非法 的 。 


代码 清单 7-12 也 提 到 了 指针 与 整数 对 象 之 间 以 及 两 个 指针 对 象 之 
间 的 算术 计算 。 这 里 指针 所 参与 的 计算 只 能 是 加 减 算 术 计 算 ， 而 不 能 
征 乘 除 。 当 指针 对 象 与 一 个 整数 对 象 参与 计算 时 ， 指 针 的 值 相 当 于 加 
或 减 了 该 整数 值 的 sizeof 〈* 指 针对 象 ) 倍 。 当 两 个 指针 对 象 相 减 时 ， 
计算 结果 是 两 个 指针 的 差 值 再 除 以 sizeof 〈\* 指 针对 象 ) 。 最 后 要 注意 
的 是 ， 两 个 类 型 相 兼 容 的 指针 对 象 只 能 做 减法 计算 ， 不 能 做 加 法 计 
入 


7.8” 指 疝 数 组 的 指 夺 


我 们 上 一 节 讲 述 了 一 维 数组 与 一 级 指针 的 关系 ， 谈 到 了 一 个 一 维 
数组 对 象 可 以 被 隐 式 地 转 为 一 个 一 级 指针 对 象 ， 使 得 一 个 一 级 指针 对 
象 能 指 回 该 数组 的 某 个 元 素 。 但 之 前 我 们 已 经 提 到 过 ， 任 何 对 象 都 有 
地 址 ， 所 以 在 C 语 言 中 都 能 定义 指 癌 任 一 对 象 类 型 的 指针 ， 数 组 也 不 
例外 。 如 果 我 们 定义 了 一 个 数组 a: “int a[3]; ”， 那 么 若 要 声明 一 个 指 
向 int[3] 类 型 的 指针 对 和 象 p 并 指向 a， 则 可 用 此 形式 : “int (*p) 

[3]=&a; ”。 这 里 ， 对 象 p 就 是 指向 数组 a 的 指针 ， 其 类 型 为 int (*) 
[3]， 表 示 指 向 一 个 int[3] 数 组 类 型 的 指针 。 这 里 要 注意 的 是 ， 吕 内 的 3 
不 能 省 ， 因 为 这 里 的 数组 对 象 a 是 一 个 定 长 数组 。 (*p) 的 类 型 则 是 
int[3] 类 型 ， 所 以 我 们 可 以 通过 “(*p) [ 订 ” 或 “p[0] 科 ”( 上 节 已 经 提 到 
过 ， (*p) 相当 于 p[0]) 来 访问 指针 p 所 指数 组 的 某 个 元 素 。 


下 面 ， 我 们 将 通过 代码 清单 7-13 来 详细 地 给 大 家 介绍 一 下 指向 数 
组 的 指针 的 特性 与 用 法 。 


代码 清单 7-13 ” 指 疝 一 维 数 组 的 指针 


#include <stdio.h> 
int main(int argc, const char * argv[]) 


// 声明 了 一 个 数组 对 象 a， 具 有 5 个 元 素 
int a[] = { 1, 2, 3, 4, 5}; 


// 声明 了 一 个 指向 int 类 型 的 指针 对 象 p， 并 将 它 指向 数组 a 的 首 个 元 素 的 地 址 


// int *p = a; 就 相当 于 : int *p = &a[9]; 
int *p = a; 


// 声明 了 一 个 指向 int[5] 数 组 类 型 的 指针 对 象 ， 数组 a 的 地 址 对 它 初始 化 
int (*pa)[5] = &a; 


// 与 sizeof(p) 结 果 相 同 ， 因 为 两 者 都 是 指针 类 型 的 对 象 


printf("size of pa is: %zu\n", sizeof(pa)); 


// 这 里 sizeof(*pa) 与 Sizeof(*p) 的 结果 就 不 同 了 : 

// 因为 (* pa) 的 类 型 十 int 5]， 所 以 sizeof(* pa) 就 相当 于 sizeof(int[5] ); 

// 而 (*p) 的 类 型 是 int, 月 Dsizeof(* p) 的 结果 就 相当 于 sizeof(int) 

printf("size of (*pa) = %zu, sizeof (*p) = %zu\n", 
sizeof(*pa), sizeof(*p)); 


int sum = 0; 


for(int i = 0; i < 5; i++) ‘ 
sum += (*pa)[i]; // 这 里 需要 注意 ， 这 里 的 圆 括号 不 能 省 


printf("sum = %d\n", sum); 


// 这 里 声明 了 一 个 二 维 数组 b[3] [5] ， 并 对 其 初始 化 
int b[3][5] = { 

《3 

41871958， 

{11, 12, 13, 14, 15} 


}; 
// 我 们 pe 个 元 素 的 地 址 。 这 里 相当 于 : pa = &b[0] 
// 一 个 二 维 数 组 其 本 质 是 一 个 数组 ， 该 数组 的 每 个 个 元素 是 一 个 一 维 数组 。 


// b 是 一 个 含 3 个 元 素 的 数组 ， 其 中 每 个 元 素 是 一 个 int[5] 的 数组 对 象 
pa = b， 


pa[9][9]++， 本 
(*(pa + 1))[9]--， // 相当 于 pa[1][9]- - 


uint64 t address = (uint64 t)pa; 


pa += 1; // 相当 于 pa = &b[1]; 
// pa += 1 也 可 看 作 : 


address += sizeof(b[0]); 


// b[9] 的 类 型 为 int[5] 
printf("address == pa? %d\n", (uint64 t)pa == address ) 


printf("b[9][9] = %d, b[2][3] = %d\n", pa[l-1][0], pa[l1][3]); 
int n = a[2]; 


// 声明 了 一 个 变 长 数组 对 象 v， 此 时 ，n 为 3， 所 以 v 具 有 三 个 元 素 


int v[n]; 


// 对 数组 对 象 v 的 每 个 元 素 进行 赋值 
v[0] = 1; v[1] = 2; v[2] = 3; 


// 声明 了 一 个 指向 变 长 数组 ijnt[n] 的 指针 对 象 pv 
// 数组 对 象 v 的 地 址 对 它 初始 化 
int (*pv)[n] = &v; 


中 


n++ 
//_n++ 对 数组 对 象 v 以 及 指向 数组 对 象 v 的 指针 pv 均 无 影响 

// Vv 的 元 素 个 数 仍然 是 3 个 ，(* pv) 的 类 型 int [n] 

// n 也 为 3 (这 里 的 n 不 是 声明 的 变量 n 的 值 ， 而 是 与 声明 变 长 数组 时 所 绑 定 的 值 ) 


printf("n = %d\n", n); 
printf ("size of (*pv) is: %zu\n", sizeof(pv[0])); 
printf("size of vV is: %zu\n" sizeof(v)); 


// 声明 了 一 个 指 I Im 的 数组 的 指针 对 象 pv2 
int (*pv2)[n] = 


// 这 里 ，(*pv2) 的 大 小 ey * 4， 即 n 为 加 1 后 的 值 
printf("size of (*pv2) is: %zu\n", sizeof(pv2[0])); 


printf("v[2] = %d\n", pv2[0][2]); 


代码 清单 7-13 详 细 描 述 了 指向 一 维 数组 的 指针 的 特性 以 及 使 用 方 
法 。 这 里 涉及 指向 一 维 数 组 的 指针 与 一 般 指针 之 间 的 区 别 ， 比 如 int*p 
和 int (*pa) [5]， 前 者 指向 了 数组 对 象 的 首 个 元 素 的 地 址 ， 而 后 者 则 
指向 了 数组 a 的 地 址 。 其 实 这 两 个 地 址 值 都 是 相同 的 ， 但 它们 的 概念 、 
合 义 都 不 相同 。 


然后 我 们 又 通过 将 指向 一 维 数 组 的 指针 对 象 pa 指 向 了 一 个 二 维 数 

组 百 个 元 素 的 地 址 ， 这 样 我 们 就 能 对 指针 与 数组 之 间 的 天 系 有 进 一 
的 了 解 了 。 与 一 维 数组 其 实 类 似 ，a 的 类 型 为 int[5]， 它 能 被 隐 式 地 转 
换 为 int*， 同 样 ，b 的 类 型 为 int[3][5]， 那 么 它 能 被 隐 式 地 转换 为 int 
(*) [5]。 这 里 大 家 能 进一步 摸 透 数组 与 指针 之 间 的 关系 ， 其 实 一 个 
数组 对 象 能 隐 含 地 表示 其 首 个 元 素 的 地 址 。 像 数组 a， 当 其 标识 符 用 于 
一 般 的 表达 式 时 ， 束 相当 于 &a[0]; 数组 b 也 是 如 此 ， 当 其 标识 符 用 作 = 
的 右 操 作 数 时 ， 束 相当 于 &b[0]。 由 于 b[0] 的 类 型 是 int[5]， 所 以 &b[0] 
自然 而 然 地 就 被 表达 为 int (*) [5]。 


最 后 一 部 分 我 们 描述 了 指向 变 长 数组 的 指针 的 特性 。 天 于 变 长 数 
组 ， 我 们 在 7.3 节 已 经 有 了 比较 详细 的 介绍 ， 这 里 不 再 痪 述 。 


以 上 描述 的 是 指 同 一 维 数组 的 指针 ， 那 么 是 否 存在 指 癌 更 多 维度 

数组 的 指针 呢 ? 答案 当然 是 肯定 的 。C 语 言 的 类 型 系统 是 相当 完备 
的 ， 既 然 存在 指向 一 维 数 组 的 指针 ， 那 么 肯定 束 会 存在 指 问 更 多 维 的 
数组 指针 。 上 面 已 经 提 到 了 ， 声 明 一 个 指 癌 含有 3 个 元 素 的 一 维 数 组 的 
指针 p 的 形式 为 : “int (*p) [3]; ”。 要 声明 指向 一 个 int[2][3] 二 维 数组 
的 指针 q 的 形式 为 : “int (*q) [2][3]; ”，dqd 的 类 型 为 "int (*) [2][3]”， 
则 这 里 [2][3] 这 两 个 方 括号 里 的 数 都 不 能 省 。 (*q) 的 类 型 则 为 int[2] 
[3]， 所 以 如 有 果 我 们 要 查询 sizeof \*q) ， 那 么 得 到 的 大 小 为 "sizeof 

(int) *3*2”。 代 码 清单 7-14 人 简单 介绍 了 指向 二 维 数 组 的 方式 以 及 用 
法 。 


代码 清单 7-14” 指 疝 二 维 数 组 的 指针 


#include <stdio.h> 


int main(int argc, const char * argv[]) 


// 声明 了 一 个 二 维 数 组 a， 具 有 2 个 元 素 ， 
// 其 中 每 个 元 素 为 一 个 int[3] 的 数组 
int a[2][3] = { 

{ 1, 2，3 

{ 4, 5, 6} 


// 声明 了 一 个 指向 二 维 数组 int[2][3] 的 指针 对 象 p， 
// 数组 a 的 地 址 对 它 初 始 化 

int (*p)[2][3] = &a; 

// 修改 二 维 数组 元 素 a[0] [9] 的 值 

(*p)[9][0] += 10; 

printf("a[0][0] = %d\n", a[0][0]); 


// 修改 二 维 数组 a[1] [2] 的 值 


pLOJ[1][2] += 
printf(' iT1]T2] = = Sk ,， a[1][2]); 


a p) 的 六 小 为 2 A ee ) 
printf("size of (* i = %zu\n", sizeof(*p)); 


代码 清单 7-14 人 简单 地 描述 了 指向 二 维 数 组 的 指针 的 使 用 以 及 特 
性 ， 这 些 可 依次 类 推 到 三 维 ， 甚 至 更 高 维 的 数组 指针 。 此 外 ， 指 同 二 
维 数组 的 指针 能 直接 指 同一 个 三 维 数组 的 首 个 元 素 的 地 址 ， 这 与 指 癌 
一 维 数 组 的 指针 可 直接 指向 一 个 二 维 数组 的 首 个 元 素 的 地 址 的 特性 类 


似 。 


7.9 void 类 型 、 指 向 void 类 型 的 指针 与 空 指针 


我 们 之 前 讲 到 的 类 型 都 是 有 其 具体 意义 的 类 型 。 在 C 语 言 中 还 有 
一 种 类 型 表示 “无 ?或 *“ 空 ”， 用 void 关键 字 来 表示 。void 一 般 用 于 函数 返 
回 类 型 以 及 表示 空 的 形 参 列表 ， 也 可 作为 表达 式 的 类 型 。 具 有 void 类 
型 的 表达 式 称 为 void 表达 式 ， 表 示 该 表达 式 不 返回 任何 值 ， 也 不 具有 
任何 有 意义 的 类 型 。 在 C 语 言 中 ， 大 部 分 表达 式 都 具有 某 个 有 意义 的 
类 型 ， 不 过 我 们 可 以 通过 投 映 操 作 ， 将 某 个 表达 式 强制 转 为 void 表达 
式 ， 比 如 : (void) 0， (void) (at+1) ， (void) (a=3) 等 都 是 属 
于 void 表达 式 。void 表 达 式 除了 可 用 作为 逗号 操作 符 的 操作 数 以 及 三 
目 条 件 操作 符 的 “? ”后 面 和 “: ”后 面 的 操作 数 之 外 ， 一 般 不 可 用 作为 
其 他 操作 符 的 操作 数 。 此 外 ，void 表 达 式 也 只 能 作为 对 void 类 型 投射 
操作 的 操作 数 ， 而 不 能 作为 对 其 他 类 型 投 映 的 操作 数 。 像 以 下 表达 式 
都 是 合法 的 : 


// 这 里 ， 对 于 (void)(void)(1 + 2) 表 达 式 ，(void)(1 + 2) 这 个 子 表达 式 就 作为 
// void 投 映 操 作 的 操作 数 。 
(void)0，(void)1， (void)(void)(1 + 2); 1 > 2 ? (void)0 : (void)1; 


在 C 语 言 中 ， 一 个 指针 可 以 指向 void 类 型 ， 即 该 指针 对 象 的 类 型 为 
void*。 如 果 一 个 指针 对 象 是 指向 void 类 型 的 指针 ， 那 么 该 指针 可 被 隐 
式 转 换 为 指 回 任 一 对 象 类 型 的 指针 。 而 指 同 任 一 对 象 的 指针 也 都 能 被 
隐 式 转 为 指向 void 类 型 的 指针 。 在 5.6 节 最 后 描述 C11 标 准 对 投 映 操 作 


符 的 约束 时 已 经 提 到 : “涉及 指针 类 型 的 转换 ， 除 了 某 些 允许 指针 类 型 
隐 式 转换 的 情况 ， 应 该 显 式 使 用 投射 操作 ”。 这 里 ， 所 谓 的 “ 某 些 允许 
指针 类 型 隐 式 转换 的 情况 ” 惑 是 指 void* 类 型 的 情况 。 因 而 void* 指 针 关 
型 往往 在 C 语 言 社 区 中 也 被 戏称 为 “万 用 指针 类 型 ” (universal 


pointer) 。 
代码 清单 7-15 举 了 一 些 使 用 指向 void 指 针 的 例子 。 


代码 清单 7-15 ”指向 void 指 针 的 一 些 例子 


#include <stdio.h> 


int main(int argc, const char * argv[]) 
{ 


int a = 10; 


// 这 里 声 个 指向 void 类 型 的 指针 对 象 p， 
// ep 四 


void *p = &a; 


// 这 里 声明 了 一 个 指向 int 的 指针 对 象 q， 
// 接 p 对 它 初始 化 。 这 里 不 需要 使 用 投射 操作 做 类 型 转换 


int *q = 


/ 


*q 十 二 10 
printf("a = %d\n", a); 


// 将 指向 void 类 型 的 指针 指向 一 个 临时 数组 对 象 的 地 址 
p = &(int[]){ 1, 2, 3} 


// 这 里 直接 将 p 转 换 为 指向 nt[3] 数 组 的 指针 类 型 ， 
// 然后 对 该 数组 人 小 加 2 修改 
(Cint(*)[3])p)[9][1] += 2; 


// 这 里 声明 个 指向 int [3] 数 组 的 指针 七 


搂 用 p 进 行 初始 化 ， 这 里 也 不 需要 任何 投射 操作 做 类 型 转换 
int (t)[3] = p; 


了 


i 
~ 
总 


// 这 里 (*t) 的 类 型 为 int[3] ， 可 直接 将 它 赋值 给 指向 int 的 指针 q 。 
// int[3] 到 int* 是 可 隐 式 转换 的 


过 *x 七 ， 
printf("q[1] = %d\n", q[1]); 


在 C 语 言 中 我 们 通常 使 用 一 个 空 指针 表示 一 个 无 效 的 、 或 未 经 初 
台 化 的 指针 对 象 ， 空 指针 使 用 宏 NULL 来 表示 。C 语 言 中 的 NULL 往 往 
会 被 定义 为 (void*) 0， 即 类 型 为 指向 void 指针 、 值 为 0 的 整数 常量 。 
通常 ， 我 们 不 能 对 一 个 空 指针 所 指 的 内 容 进 行 读 写 。 举 一 个 简单 的 例 
子 :“int*p=NULL; ”， 这 里 p 就 被 初始 化 为 一 个 空 指针 。 


一 般 来 说 ， 我 们 在 函数 里 声明 一 个 局 部 指针 对 象 时 ， 如 有 果 未 对 它 
做 有 意义 的 初始 化 ， 那 么 可 以 先 将 它 指向 空 ， 否 则 该 局 部 指针 对 象 的 
值 是 不 确定 的 ， 这 种 情况 在 C 语 言 社区 中 也 将 它 戏 称 为 “ 野 指 和 外” (wild 
pointer) ， 即 不 受 控 的 指针 。 如 果 用 空 (NULL) 来 标识 该 指针 为 无 效 
指针 ， 那 么 显然 更 容易 做 判断 处 理 。 而 如 果 一 个 指针 对 象 指 向 了 一 块 
动态 分 配 的 内 存 空 间 ， 当 此 内 存 空 间 被 释放 之 后 ， 那 么 我 们 也 可 以 将 
该 指针 指向 空 ， 表 示 它 已 经 失效 了 ， 否 则 该 指针 对 象 也 会 成 为 “ 野 指 
针 ”。 这 对 声明 在 文件 的 作用 域 并 且 被 多 个 模块 所 访问 的 指针 对 和 象 来 说 
尤为 有 用 。 


7.10 ”字符 数组 与 字符 串 字 面 量 


在 C 语 言 中 ， 字 符 串 字面 量 是 一 个 比较 特殊 的 类 型 。 在 C99 标 准 中 
只 有 默认 的 ASCII 字 符 集 的 字符 串 字 面 量 以 及 系统 环境 定义 的 宽 字 符 
串 子 面 量 两 种 ， 而 C11 标 准 还 引入 了 UTF-8 子 符 串 、UTF-16 了 字符 串 以 


及 UTF-32 字 符 串 。 


结束 符 。 该 结束 符 可 被 库 函 数 strlen 等 使 用 ， 用 于 获取 当前 字符 串 的 长 
度 〈 即 字符 个 数 通 常 也 实现 为 字 市 个 数 ) 。 比 如 ，"abc" 是 含有 3 个 
ASCII 码 字符 的 一 个 字符 串 ， 但 它 的 类 型 是 char[4]， 即 实质 上 是 一 个 含 
有 4 个 ASCII 码 字符 的 数组 (最 后 一 个 字符 为 \0') 。u"abc" 是 含有 3 个 
UTF-16 编 码 字符 的 一 个 字符 串 ， 它 的 类 型 为 char16_t[4] 的 数组 (最 后 


一 个 字符 为 NW0) 。 


一 个 字符 串 子 面 量 的 类 型 虽然 是 一 个 数组 类 型 ， 但 相 比 于 数组 的 
语法 体系 却 还 有 一 些 例外 特性 。 首 人， 尽管 字符 串 字 面 量 的 类 型 是 一 
个 字符 数组 类 型 ， 且 不 是 常量 ， 但 C 语 言 标准 明确 指出 ， 对 字符 串 字 
面 量 中 的 字符 进行 修改 是 一 个 未 定义 的 行为 。 此 外 ， 字 符 串 字面 量 可 
直接 给 一 个 字符 数组 进行 初始 化 。 代 码 清单 7-16 列 出 了 这 些 特性 。 


代码 清单 7-16 ”字符 串 字 面 量 的 一 些 特性 


#include <stdio.h> 
#include <string.h> 
#include <wchar.h> 


#include "uchar.h" 
int main(int argc, const char * argv[]) 


{ 


// "abc" 是 一 个 兼容 ASCII 码 的 系统 编码 形式 的 字符 
const char *asciiString = "Hello, world",; 


// u8" 你 好 ， 世 界 " 是 一 个 UTF-8 编 码 的 字符 串 
const char *utf8String = u8" 你 好 ， 世 界 "， 


ny 


// u" 你 好 ， 世 界 "是 一 个 UTF-16 编 码 的 字符 串 
const char16_t *utf16String = u" 你 好 ， 世 界 " 


// U" 你 好 ， 世 界 " 是 一 个 UTF- 32 编 码 的 字符 串 
const char32_t *utf32String = U" 你 好 ， 世 界 " 


// L" 你 好 ， 世 界 " 是 一 个 系统 编码 形式 的 宽 字符 串 
const wchar_t rw et ng = = L" 你 好 ， 世 界 " ; 


printf("asciiString: %s\n", asciiString); 
printf("utf8String: %s\n", utf8String); 


// 可 以 直接 字符 串 字面 量 给 一 个 字符 数组 对 象 进行 初始 化 
// 此 时 ， oe 
char s[] = "abc"; 


// 这 里 要 注意 的 是 ， 数 组 对 象 s 所 在 的 地 址 并 不 与 字符 串 "abc" 所 在 的 地 址 相同 
printf("The address of s is: %.16tX\n", (uintptr_t)s); 
printf("The address of string is: %.16tX\n", (uintptr_t)"abc"); 


printf("size of s is: %zu\n", sizeof(s)); 


// 输出 结果 为 6， 除 了 hel1lo 这 5 个 字符 外 最 后 还 有 一 个 '\0' 结 束 符 ， 一共 6 个 字符 
// 因而 "hello" 的 类 型 为 char[6] 类 型 
printf("The size of string is: %zu\n", sizeof("hello")); 


// 当然 ， 我 们 也 可 以 用 一 个 字符 数组 字面 量 ( 即 匿名 数组 ， 对 一 个 数组 对 象 进行 初 始 化 
char a[] = (char[]){ 'a', 'b', 'c', AN }; 


// 我 们 调 strcmp 库 函数 来 比较 两 个 字符 数组 的 内 容 是 否 相同 
// 如 果 相同 返回 9， 否 则 返回 一 个 负数 说 明 s 的 内 容 小 于 a 的 内 容 ; 
// 返回 一 个 正 数 说 明 s 的 内 容 大 于 a 的 内 容 

int equal = strcmp(s, a); 

printf("Result is: %d\n", equal); 


// 这 里 字符 数组 对 象 b 尽 管 含有 6 个 字符 元 素 ， 但 字符 串 长 度 仍然 为 3， 
// 因为 索引 3 元 素 为 '\0'， 表 示 字 符 串 结束 符 
char b[] 二 { 'a', bs SG '\0'", 'd', 'e! }; 


| 


printf("array b size: %zu\n", sizeof(b)); 
printf("b string length: %lu\n", strlen(b)); 


// 比较 字符 数组 b 与 字符 串 s 是 否 相 同 
equal = strcmp(b, s); 
printf("equal is: %d\n", equal); 


char b[] = s; 这 句 是 非法 的 ! 不 能 将 一 个 数组 对 象 给 另 一 个 数组 对 象 进行 初始 化 


标准 库 头 文件 <string.h> 中 列 出 了 许多 丰富 的 字符 串 操 作画 数 ， 比 
如 字符 串 比 较 、 获 取 字 符 串 长 度 、 字 符 串 拷贝 等 。 代 码 清单 7-16 展 示 
了 C 语 言 中 字符 串 字 面 量 的 特性 以 及 如 何 用 字符 数组 表示 一 个 字符 串 
的 方式 。 如 果 各 位 在 编译 环境 中 没有 <ucharh> 头 文件 ， 那 么 可 以 使 用 
5.1.7 玫 中 的 代码 清单 5-8 作 为 头 文件 进行 包含 。 


C 语 言 中 ， 字 符 串 字面 量 另 一 个 有 趣 特 性 束 是 可 进行 拼 搂 。 相 邻 
儿 个 字符 串 字 面 量 可 拼接 在 一 起 ， 形 成 一 个 字符 串 字 面 量 ， 比 如 : 字 
符 吕 "abc""def" 即 可 表示 一 个 完整 的 字符 串 "abcdef"。 两 个 字符 串 字 面 
量 之 间 可 以 有 有 零 个 或 多 个 空 日 符 分 隔 。 但 这 里 要 注意 的 征 ， 进 行 拼接 
的 几 个 字符 串 的 类 型 必须 一 致 ， 比 如 几 个 UTF-8 编 码 的 字符 串 可 进行 
拼接 ， 几 个 宽 字 符 串 字面 量 也 可 进行 拼接 ， 但 一 个 UTF-16 字 符 串 与 一 
个 宽 字 符 串 字面 量 之 间 就 无 法 进行 拼 撑 。 在 字符 串 字 面 量 进行 拼接 
时 ， 无 前 级 的 字符 串 字 面 量 可 被 任意 拼接 ， 这 将 形成 在 所 拼接 的 字符 
串 字 面 量 中 含有 某 一 前 绥 的 字符 串 类 型 。 代 码 清单 7-17 将 介绍 字符 串 
拼接 特性 。 


代码 清单 7-17 字符 串 字 面 量 的 拼接 特性 


#include <stdio.h> 
#include <string.h> 
#include <wchar.h> 
#include <uchar.h> 


int main(int argc, const char * argv[]) 


// 这 里 ，"a" 与"b" 之 间 个 空格 分 隔 ，"b" 与 U"c" 之 间 没 有 任何 空白 符 。 
// 在 所 有 字符 串 字 面 量 中 由 于 第 三 个 字面 量 u"c" 具 有 前 绥 u， 
// 所 以 整个 字符 串 为 一 个 UTF-16 编 码 的 字符 串 u"abc" 


const char16_t *utf1i6String = "a" "b"u"c",; 


// 这 里 与 上 述 字 符 吓 


字面 量 等 价 


utf1i6String = U' 


re ed © U"c",; 


// 习惯 上 ， 一 般 我 们 可 以 这 么 写 
S 


Utf16String = U' 


1 HM ol ely 


const char *s = 


// 字符 串 字面 量 也 可 以 用 换行 分 隔 ， 换 行 也 属于 空白 符 
nd ven 
"f" 


printf("s = %s\n", s); 


// 以 下 这 种 字符 串 书 


接 方式 是 错误 的 。u 前 级 字面 量 与 U 前 级 的 3 


不 外 


接 在 


const char16_t *errorString = u"a" U"b" "c",; 


已 


7.11 完整 与 不 完整 类 型 


在 C 语 言 中 ， 类 型 被 划分 为 对 象 类 型 和 画 数 类 型 。 在 一 个 翻译 单 
元 内 ， 一 个 对 象 类 型 在 多 个 位 置 可 能 是 不 完整 的 ， 也 可 能 是 完整 的 。 
所 谓 不 完整 类 型 吏 是 指 缺乏 足够 的 信息 去 判定 用 该 类 型 所 声明 对 象 的 
pa 


在 C 语 言 中 ， 一 个 void 表 达 式 表示 不 存在 值 ， 此 类 型 是 一 个 不 完整 
类 型 ， 并 且 不 能 对 它 隐 式 或 显 式 转换 为 其 他 类 型 。 如 采 具 有 其 他 类 型 
表达 式 的 计算 结 采 为 一 个 void 表达 式 ， 那 么 其 值 和 所 表示 的 标识 符 都 
会 被 丢弃 。 比 如 ， (void) 《2+3) ; 这 个 表达 式 就 是 一 个 void 表达 
式 ， 它 不 能 给 任 一 类 型 的 对 象 赋值 。 


只 含有 一 个 枚 举 类 型 、 结 构 体 、 联 合体 标识 符 的 声明 也 是 不 完整 


类 型 ， 因 为 它们 没有 任何 信息 来 描述 目 己 。 


一 个 指向 不 完整 类 型 的 指针 类 型 是 一 个 完整 类 型 ， 因 为 指针 类 型 
对 象 的 大 小 明确 ， 所 以 指向 void 类 型 的 指针 也 属于 完整 类 型 。 代 码 清 
单 7-18 举 了 一 些 例子 进行 说 明 。 


代码 清单 7-18 ”完整 与 不 完整 类 型 


#include <stdio.h> 


// 这 里 声明 了 一 个 名 为 MyStruct 的 结构 体 类 型 ， . 
// 由 于 缺乏 对 该 类 型 的 明确 定义 ， 因 此 在 当前 翻译 单元 的 这 个 位 已 是 一 个 不 完整 类 型 
struct MyStruct; 
static void foo(void) 
{ 
// 这 里 对 象 p 是 一 个 指向 MyStruct 结 构 体 的 指针 ， 
// struct MyStruct* 是 一 个 完整 类 型 
struct MyStruct *p = NULL; 
// 这 里 如 果 写 : struct MyStruct s; 将 会 报错 。 
// 一 个 不 完整 类 型 不 能 声明 该 类 型 4 的 一 个 人 对象。 
printf("The size is: %zu\n", sizeof(p)); 
// 这 里 表达 式 (void)(2 + 3) 是 一 放 void 表 达 式 ， 
// 因此 可 以 加 在 return 语 句 后面 返回 。 如 果 这 里 缺 省 (void ) ， 将 会 编译 报错 
return (void)(2 + 3); 
} 
// 于 这 里 对 结构 体 MyStruct 进 行 了 明确 的 定义 ， 所 以 在 当前 翻译 单元 的 这 个 位 
// 它 现 在 是 一 个 完整 类 型 了 。 
struct MyStruct 
int 工 
float f; 
// 由 于 在 此 刻 ，MyStruct 尚 未 定义 完成 ， 因 此 它 在 此 位 置 仍然 是 不 完整 类 型 。 


int 


// 如 果 要 定义 : struct MyStruct s; 编译 器 
可 定义 指向 MyStruct 结 构 体 
Struct MyStruct *p， 


// 如 果 一 个 结构 


// 但 


// 最 后 


将 


会 报错 


类 型 的 指针 对 象 作为 成 员 


a 体 至 少 含有 一 个 命名 成 员 对 象 中 么 最 后 可 跟 个 不 指定 大 小 的 数组 。 
指定 大 小 的 数组 对 象 也 是 一 个 不 完整 类 型 ， 但 数组 元 素 的 类 型 必须 是 完整 的 ， 
// 所 以 这 里 array[i] 的 类 型 是 voijd*， 它 是 一 个 完整 类 型 
“MyStruct 鲁 构 体 类 还 的 天 小 


// 成 员 array 不 


void* a 


main(in 


foo( ); 


rray[]; 


t argc, const char * argv[]) 


// 一 个 完整 类 型 可 以 声明 该 类 型 的 一 个 对 象 
struct MyStruct s = { 10，0.5f }; 


printf( 


// 在 64 位 系统 下 ， 


printf( 


"The Value is: %f\n", 


"size is: %zu\n", sizeof(Ss)); 


SS) 


结构 体 MyStruct 类 型 的 大 小 为 16 


由 于 一 个 不 完整 类 型 无 法 确定 其 大 小 ， 
_Alignof 的 操作 数 。 


yd 


个 字 节 


因此 它 不 能 作为 sizeof 、 


7.12 灵活 的 数组 成 员 


在 C 语 言 中 ， 在 至 少 合 有 一 个 命名 成 员 对 象 的 结构 体 中 ， 其 最 后 
一 个 成 员 可 以 是 一 个 不 完整 数组 类 型 ， 即 不 指定 数组 长 度 (如 7.11 节 
的 代码 清单 7-18 中 定义 的 结构 体 所 示 ) ， 该 成 员 被 称 为 灵活 的 数组 成 

。 在 大 部 分 情况 下 ， 有 灵活 的 数组 成 员 是 被 忽略 的 ， 而 结构 体 的 大 小 
也 不 把 灵活 的 数组 成 员 给 算 进去 ， 但 是 字 节 填充 会 受到 有 灵活 的 数组 成 
员 类 型 的 影响 。 当 我 们 用 “.” 或 “->” 成 员 访 问 操 作 符 去 访问 灵活 的 数组 
成 员 时 ， 该 成 员 的 偏 移 量 往往 就 是 结构 体 自身 大 小 。 


代码 清单 7-19 给 出 了 灵活 的 数组 成 员 的 一 些 特性 以 及 常用 实践 方 
Ss 


代码 清单 7-19 灵活 的 数组 成 员 


#include <stdio.h> 

#include <stddef.h> 

#include <stdlib.h> 

int main(int argc, const char * argv[]) 
struct Test1 


int8_t b; 


// 这 里 d 就 是 灵活 的 数组 成 员 ， 这 里 如 果 不 声明 此 成 员 ， 

// 那么 结构 体 Test1 的 大 小 仅 为 1 个 字 节 ， 但 声明 了 此 成 员 之 后 ， 

// 为 了 对 该 成 员 访问 的 需要 ， 而 对 整个 Test1 类 型 做 了 字 节 填充 ， 到 8 个 字 节 
double d[]; 


}; 


// 获得 成 员 d 所 在 Test 结 构 体 中 偏 移 量 
Slize t offset = offsetof(struct Test1, d); 


// 这 里 偏 移 量 与 结构 体 Test 的 大 小 都 一 样 ， 均 为 8 个 字 节 
printf("offset is: %zu\n", offset); 


printf("size is: 


struct Test2 


%zu\n", sizeof(struct Test1)); 


int a; 
// 这 里 array 是 灵活 的 数组 成 员 。 
// 由 于 array 所 在 的 偏 移 位 置 正好 是 与 nt 对 齐 的 ， 
// 因此 整个 结构 体 Test2 无 需 再 做 字 节 填充 
int array[]; 
}; 
printf("size of struct Test2: %zu\n", sizeof(struct Test2)); 
// 这 里 声明 了 一 个 Test2 才 构 体 数组 对 象 ts， 它 共 有 三 个 元 素 。 
// 这 里 相当 于 : ts[0].a = 10; ts[1].a = 20; ts[2].a = 30; 
Struct Test2 ts[] = {{ 10 }, { 20 }, {30 } }; 
// 这 里 我 们 可 以 很 清晰 地 观察 到 ， 
// 结构 体 Test2 中 的 array 成 员 所 在 1 移 也 正好 是 Test2 的 大 小 ， 
// 这 样 当 我 们 访问 ts 数组 的 第 一 个 元 素 的 array 成 员 时 ， 
// 该 array 正 好 指向 第 二 个 元 素 的 起 始 地 址 。 
// 这 就 好 比 : ts[0] .array = &ts[1]; ts[1].array = &ts[2]; 
int Sum = ts[0].array[0] + ts[1].array[0]; 
// 这 里 sum 的 结果 为 20 + 30 = 50 
printf("sum = %d\n", sum); 


种 常用 使 


// 灵活 的 数组 成 员 还 有 


方式 是 对 整个 结构 体 类 型 做 动态 存储 分 配 ， 


// 这 样 ， 我 们 可 以 根据 当前 上 
// 比如 这 里 给 
// 分 配 了 由 变量 sum 所 指定 的 数组 元 
struct Test2 *pt = malloc(s 


// 这 里 8 到 了 在 


将 会 i 


第 8 寻 


文 
合 pt 所 指 让 向 的 Test2 结 构 体 对 象 中 的 array 成 员 ， 


确定 灵活 的 数组 成 员 到 底 给 它 分 配 多 大 的 存储 空 


元 素 个 数 
izeof(*pt) + sizeof(double[sum])); 


到 的 for 循 环 语句 


for(int i = 0; i < sum; I++) 


pt->array[i] = i+1.0; 


double result = pt->a; 


for(int i = 0; i < sum; i++) 


result += pt->array[i]; 


printf("result is: %f\n", r 


代码 清单 7-19 中 用 了 C 语 言 
x 间 大 小 ， 


空间 动态 分 配 指定 的 存储 罕 
Es 


esult); 


示 准 库 的 malloc 函 数 ， 
其 原型 包 


间 。 


该 函数 从 存储 堆 
含 在 了 <stdlib.h> 标 准 座 


7.13 “本章 小 结 


本 章 主 要 讲述 了 C 语 言 中 的 数组 与 指针 相关 话题 。 本 章 也 征 相 对 
比较 有 难度 的 章节 ， 和 硕 望 C 语 言 初学 着 能 反复 阅读 、 实 践 。 数 组 与 指 
针 类 型 可 进行 各 种 组 合 、 变 化 ， 这 也 体现 出 C 语 言 类 型 系统 的 强大 与 
灵活 ， 但 又 不 失 簿 少 性 。 如 有 果 能 把 本 章 内 容 掌 握 好 ， 那 么 对 于 C 语 言 
的 一 大 主要 问题 也 束 解 决 了 。 


至 此 ， 天 于 C 语 言 中 的 类 型 就 全 都 讲解 完了 。 第 8 章 与 第 9 章 将 分 
别 介绍 C 语 言 中 的 控制 流 语句 以 及 函数 。 


第 8 草 ”C 语 言 的 控制 流 语 句 


第 5 一 7 甘 主 要 讲解 了 C 语 言 中 的 各 种 对 象 类 型 以 及 各 种 字面 量 ， 
随 之 讲解 了 对 象 的 声明 以 及 一 些 简单 的 算术 逻辑 计算 、 赋 值 语句 的 写 
法 。 本 章 将 为 大 家 介绍 C 语 言 的 控制 流 语句 ， 用 来 表达 语句 的 分 支 和 
循环 执行 。 我 们 将 先 介 绍 喜 号 表达 式 与 条 件 表达 式 ， 这 两 个 表达 式 具 
有 魔法 般 的 表现 力 ， 往 往 能 把 一 些 语句 的 表达 进行 简化 。 随 后 ， 我 们 
会 介绍 C 语 言 中 的 选择 语句 (selection statement) if-else 以 及 switch- 
case，C 语 言 中 的 选择 语句 就 是 我 们 通常 所 谓 的 分 文 语句 。 紧 接着 会 介 
绍 while、do-while 以 及 for 迭 代 语 句 来 表示 循环 ， 执 行 一 次 循环 又 可 称 
为 执行 一 次 迭代 。 最 后 我 们 会 介绍 C 语 言 中 的 goto 跳 转 语句 ， 这 是 最 能 


体现 处 理 右 控制 流 执 行 的 表达 式 ， 但 在 使 用 时 需要 注意 一 些 事项 。 


C 语 言 文 持 辟 号 表达 式 ， 用 于 将 铬 干 表 达 式 按 指定 次 序 执行 ， 最 
终 返 回 最 后 一 个 表达 式 的 结果 。 比 如 ， 像 inta= (0，2，3) ; 这 条 语 
名 执行 后 ，a 的 值 为 9。 逗号 操作 符 是 一 个 双 目 操作 符 ， 其 左边 的 操作 
数 称 为 左 操 作 数 ， 其 右边 的 操作 数 则 称 为 右 操 作 数 。 比 如 表达 式 (0， 
2) 中 ，0 是 左 操 作 数 ，2 是 石 操 作 数 。 吉 号 表达 式 的 左 操 作 数 与 右 操 作 
数 之 间 有 一 个 顺序 点 ， 因 此 右 操作 数 能 确保 在 左 操作 数 所 产生 的 所 有 
副作用 完成 后 再 进行 执行 。 这 个 特点 束 与 分 号 的 作用 类 似 。 不 过 之 所 
以 要 引入 去 号 表达 式 ， 其 主要 目的 是 将 最 后 一 个 表达 式 的 计算 结 采 给 

返回 出 来 ， 而 分 号 则 表示 整个 表达 式 的 终结 ， 并 不 具备 这 个 特性 


在 使 用 逗号 表达 式 的 时 候 还 需 注 意 ， 由 于 逗号 操作 符 的 优先 级 是 
最 低 的 ， 因 此 如 号 表达 式 往往 会 用 圆 括号 操作 符 括 起 来 ， 使 得 它们 作 
为 一 个 整体 的 基本 表达 式 不 会 被 其 他 操作 符 分 隔 开 。 代 码 清单 8-1 列 举 
了 去 号 表达 式 的 特性 以 及 需要 注意 的 事项 。 


代码 清单 8-1 喜 号 表达 式 


#include <stdio.h> 


int main(int argc, const char * argv[]) 


// = 前 的 int a，b 表 示 对 象 a 和 b 的 声明 符 ， 忆 们 之 间 的 逗号 表示 对 标识 符 的 5 分 隔 ， 
// OR 因为 过 号 操作 符 的 功能 仪 有 长 达 式 

// = 后 面 的 (2， 3， 4) 则 是 一 个 逗号 表达 式 ， 表示 给 对 象 b 赋 值 为 4 

// 这 条 语句 相当 手 : int a; 2; 3; int b = 4; 


int a, b = (2, 3, 4); 


// 这 里 相当 于 : a = 2; b = 3; 4; 
a=2, b= 3, 4; 
printf("a = %d, b = %d\n", a, b); 
// 这 里 相当 于 b = 3; a = 4;， 因 为 赋值 操作 符 的 优先 级 要 大 于 去 号 操作 符 
a= (b= 3, 4); 
printf("a = %d, b = %d\n", a, b); 
// 尽管 这 里 有 后 缀 t+ 操作 符 ， 但 之 前 已 经 提 到 过 ， 逗 号 操作 符 的 左右 操作 数 之 间 存 在 顺序 点 
// 因此 右 操作 数 执行 前 需要 处 理 完 左 操 作 数 所 产生 的 所 有 副 作 
// 因而 ， 这 里 相当 于 : b++; int tmp = b += 4; a = tmp; 
// a 和 b 的 值 均 为 8 
a= (b++, b += 4); 
printf("a = %d, b = %d\n", a, b); 
// 这 里 就 相当 于 : b = a++; b=b- 1; 
b= (b= at++, b 1); 
printf("a = %d, b = %d\n", a, b); 
} 
\ 瑟 Vy = 吾 号 ND 赤 二 
在 使 用 逗号 表达 式 时 还 需要 注意 一 点 ， 当 去 号 作为 特定 上 下 文 的 


特定 分 隔 语 义 使 用 时 ， 它 就 不 能 做 去 


可 以 用 圆 括号 将 整个 辟 号 表达 式 括 


号 表达 式 的 操作 符 使 用 了 ， 此 时 
起 来 作为 一 个 整体 的 基本 表达 式 ， 


这 样 可 以 将 作为 操作 符 的 逗号 与 表 
printf (“at+b=%d, a-b=%dn”, (b 


(b++，a+b) 的 圆 括号 就 不 能 省 ， 
数 。 


示 分 隔 用 的 喜 号 进行 区 分 。 比 如 : 
++，a+b) ，a-b) ; 里 ， 表 达 式 


因为 其 圆 括 号 外 的 逗号 用 于 分 阳 参 


8.2 条件 表达 式 


在 C 语 言 中 有 一 种 非常 便捷 的 用 于 执行 条 件 分 文 的 表达 式 ， 即 条 
件 表达 式 。 它 征 一 个 三 目 表 达 式 ， 由 标点 符号 ? 与， 共同 构成 。 其 表 
达 式 的 形式 为 : 


这 组 表达 式 的 执行 逻辑 为 ， 如 果 布 尔 表达 式 的 值 为 “ 真 "， 那 么 执 
行 表 达 式 1; 否则 执行 表达 式 2。 正 由 于 这 里 的 ? 与 : 共同 构成 了 一 个 
三 目 操作 符 ， 所 以 其 操作 数 也 束 有 3 个 一 “? ”之 前 的 布尔 表达 
式 、“: ”之 前 的 表达 式 1， 以 及 “: "之 后 的 表达 式 2。 三 目 操作 符 的 优 
先 级 比较 低 ， 它 仅 比 赋值 操作 符 要 高 一 级 而 已 。 


代码 清单 8-2 展 示 了 表达 式 的 用 法 以 及 一 些 需 要 注意 的 地 方 。 
代码 清单 8-2 条件 表 达 式 


#include <stdio.h> 


int main(int argc, const char * argv[]) 


// 旧 ee 操作 符 优先 级 大 于 赋值 操作 符 ， 
// 所 以 后 面 的 (b = -1) 这 句子 表达 式 需要 加 上 圆 括号 
// 否则 aa > op b =1 : b= -1 相当 于 : Ee 
// 这 样 就 会 引发 编译 报错 
// 这 里 a > 9 的 表达 式 为 真 ， 所 以 执行 b = 1 子 表达 式 


printf(， 'b = %d\n", b); ' 


// 这 里 a < 9 的 结果 为 假 ， 所 以 执行 a - 19 的 表 i 


// 因此 ， 整 个 结果 表达 式 为 : b = a - 10; 
b=a<0?a+10 :a - 10; 
printf("b = %d\n", b); 


8.3 ”if-else 语 句 


if-else 语 句 在 C 语 言 中 属于 一 种 选择 语句 ， 用 来 表达 不 同 的 执行 分 
文 。 计 语句 的 形式 为 : 


if ( 表达 式 ) 语句 ; 


表示 当 表 达 式 为 真 时 执行 语句 。 


如 果 我 们 要 表达 : 当 表 达 式 为 假 时 执行 男 一 条 语句 ， 那 么 可 以 添 
加 else。 其 形式 为 : 


if ( 表达 式 ) 语句 1 
else 语句 2，) 


表示 当 表 达 式 为 真 时 执行 语句 1， 否 则 执行 语句 2 。 


C 语 言 中 的 if-else 语 句 与 我 们 在 工作 中 遇 到 的 分 支流 程 图 很 类 似 。 
比如 图 8-1 所 示 的 场景 。 


处 理 6 处 理 7 


8-1 if-else 逻辑 流程 


图 8-1 中 ， 处 理 1、 处 理 2 到 处 理 3 的 分 支 逻 辑 就 是 if 逻 辑 。 表 示 : 


if( 表 达 式 1 为 真 ){ 执行 处 理 2 } 执行 处 理 3 


说 明 只 有 当 表 达 式 为 真 时 执行 处 理 2 的 逻辑 ， 但 无 论 表 达 式 是 否 为 
真 ， 最 终 都 会 执行 到 处 理 3 的 逻辑 上 。 


而 从 处 理 4 到 处 理 7 展现 的 是 if-esle 的 逻辑 。 表 示 : 


(表达 式 2 为 真 ) { 执行 处 理 5 } else { 执行 处 理 6 } 执行 处 理 7 


—h 


i 


说 明 当 表达 式 2 为 真 时 ， 执 行 的 是 处 理 5 的 人 逻辑， 如 采 为 假 则 执行 
处 理 6 的 人 逻辑， 最终 都 执行 到 处 理 7 的 逻辑 。 


代码 清单 8-3 则 展示 了 if-else 语 句 的 具体 用 法 以 及 需要 注意 的 一 些 
事项 。 


代码 清单 8-3 if-else 语句 


#include <stdio.h> 


int main(int argc, const char * argv[]) 


{ 
int a = 10, b= 0, c=1; 


// 这 里 的 jf 语句 表明 ， 当 a > 0 时 执行 b = -1; 
// if 语 句 后 面 可 以 跟 一 条 语句 


if(a > 0) 
b = -1; 
b++; 
// 这 里 需要 注意 的 是 和 的 b++; 语句 无 论 if 中 表达 式 的 条 件 是 否 为 真 都 会 执行 。 
// 因为 if 语句 后 只 能 跟 一 条 语句 (这 里 的 b=-1; 就 是 一 条 语句 ， 而 b++; 则 属于 男 一 条 ) ， 
// 因此 这 里 的 b++ 与 上 述 的 b++ 属 于 相同 位 置 ， 即 在 if 语 句 之 外 。 
if(a > 20) 
b = -1; b++; 
// 如 果 我 们 要 在 一 条 if 语 句 内 包含 多 条 语句 ， 那 么 可 以 用 语句 块 
if(a > 0) 
{ 
// 当 a > 0 为 真 时 ， 执 行 这 两 条 语句 
b++; 
C++ ， 


} 


// 这 里 使 用 了 if-else 语 句 ， 说 明 当 a < 9 为 真 时 执行 b- - ; 
// 如 果 为 假 则 执行 c++ ; 
if(a < 0) 


else // 这 里 el1se 的 用 法 与 if 一 样 ， 后 面 可 跟 一 条 语句 


C++ 


if(c > 0) 
{ 


ar++ ， 
b++; 


DPpO 


printf("a = %d, b = %d, c = %d\n", a, b, c); 


// if 语 句 本 身 也 属于 一 条 语句 ， 因 此 
if(a > 0) 
if(b > 0) 
if(c > 0) 


puts("OK!"); 


// 相当 于 : 
if(a > 0) 

if(b > 9) 

if(c > 0) 
puts("OK!"); 

} 
} 
// if 与 else 后 面 可 直接 跟 一 个 空 语句 ， 这 么 一 来 ，if 或 else 则 不 执行 任何 操作 。 
if(a > 0); // 这 是 一 条 跟 在 if( ) 后 面 的 空 语句 
if(a > 0) 

Ba++， 
else; // 这 是 一 条 跟 在 else 后 面 的 空 语句 


代码 清单 8-3 中 涉及 C 语 言 中 的 语句 (statement) 语法 问题 ， 这 里 
先 简 单 提 一 下 。C 语 言 一 共有 以 下 几 种 语句 : 标签 语句 、 复 合 语句 、 
表达 式 语句 、 选 择 语句 、 和 迭代 语句 、 跳 转 语 句 。 这 里 像 证 (a>0) 、 
b=-1; b++; 等 都 属于 一 条 语句 。if (a>0) 是 一 条 选择 语句 ，b=-1; 
则 是 表达 式 语句 ， 而 复合 语句 是 由 们 包围 的 一 个 语句 块 ， 其 中 人 中 可 
包含 多 条 语句 。 这 里 除了 表达 式 语句 ， 其 他 语句 都 不 具有 返回 类 型 ， 
类 似 于 一 条 void 表达 式 语 句 。 


8.4” switch-case 语 人 句 


switch-case 语 句 是 C 语 言 中 第 二 种 选择 语句 ，switch-case 的 一 般 表 


达 形 式 .为 : 


switch ( 表达 式 ) 


case 整数 常量 表达 式 1: 
语句 1， 


bre eak; 
case 整数 常量 表达 式 2: 
语句 2，; 
break; 
default: 
语句 3， 
break; 


这 里 ，switch () 选择 语句 中 的 表达 式 应 该 具有 一 个 整数 类 型 
(包括 字符 类 型 和 布尔 类 型 ， 而 不 能 是 其 他 类 型 ， 后 面 走 哪 条 case 

分 文 驶 根据 该 表达 式 的 值 进行 选择 。 一 个 switch 语 句 块 癸 中 可 包 
条 case 标 签 语句 。 每 个 case 标 签 语句 的 表达 式 应 该 是 一 条 整数 常量 
式 ， 并 且 在 一 个 switch 语 句 块 中 不 应 该 存在 包含 相同 整数 常量 的 任意 
两 条 case 标 签 语 句 。 如 果 switch 中 的 表达 式 的 值 与 某 一 个 case 标 签 语句 
中 的 常量 值 相同 ， 那 么 就 执行 该 case 标 签 下 的 语句 。break 跳 转 语句 用 
于 跳出 当前 整个 switch 语 句 块 而 不 继续 往 下 执行 。 在 switch 语 句 块 中 最 
多 允许 存在 一 条 default 标 签 语 句 ， 表 示 当 switch 选 择 语句 中 的 表达 式 的 
值 没有 与 任 一 case 标 签 语句 后 的 常量 表达 式 的 值 匹配 时 ， 则 执行 default 
标签 后 的 语句 。 倘 者 switch 表 达 式 的 值 没有 与 任 一 case 标 签 的 党 


式 的 值 匹配 ， 且 不 存在 default 标 等 ， 则 不 执行 整个 switch 语 句 块 中 的 内 


在 case 或 default 标 签 下 的 语句 中 不 能 声明 一 个 临时 对 象 ， 由 于 它 在 
整个 switch 语 句 块 的 作用 域内 ， 因 此 它 可 能 对 其 他 case 分 文 可 见 ， 但 它 
执行 到 该 分 文 时 ， 其 值 可 能 还 没有 被 正确 初始 化 。 因 此 ， 如 采 我 们 在 
某 一 case 分 文 下 委 表 达 一 些 比较 复杂 的 语句 ， 则 必须 使 用 复合 语句 ， 
即 加 上 {}， 在 介 中 可 声明 临时 对 象 。 


代码 清单 8-4 将 搬 述 switch-case 语 句 的 一 般 用 法 以 及 一 些 需 要 注意 
的 地 方 。 


代码 清单 8-4 ”switch-case 语 句 


#include <stdio.h> 
int main(int argc, const char * argv[]) 


int a 
int b 


10; 
0, 


// 这 里 对 a + 1 的 值 进行 判断 
switch(a + 1) 


// 如 果 表 达 式 a + 1 的 值 为 10， 则 执行 case 19 标 签 下 的 语句 


case 10: 
b += a; // 执行 b += a 
break; // 跳出 整个 switch 语 句 块 


// 如 果 表 达 式 a + 1 的 值 为 11， 则 执行 case 11 标 签 下 的 语句 
case 11: 
b -= a; 
break; 


// 跳出 整个 switch 语 句 块 


} 
printf("b = %d\n", b); 
switch(a) 


case 10: 
b = 0; 


这 里 没有 break 语 句 ， 因 此 当 执 行 完 case 106 下 的 所 有 语句 时 ， 
紧 接 着 还 会 执行 它 下 面 的 case 12 下 的 语句 


case 12: 


b++; 


break; // 这 里 的 break 将 跳出 整个 switch 语 句 块 
} 
printf("b = %d\n", b); 
switch(b) 
case 0: 
a= 0; 
break; 
// 当 switch 选 择 语句 中 的 表达 式 b 的 值 
// 无 法 匹配 这 里 switch 语 句 块 中 所 有 的 case 常 量 表达 时 ， 
// 则 执行 defualt 标 签 语句 下 的 语句 
defauilt: 
{ 
// 如 果 要 在 switch 语 名 块 中 的 任 一 标签 语句 下 声明 个 临时 对 象 ， 
// 则 必须 使 用 复合 语句 ， 即 用 { } 将 整个 上 下 文 包围 起 来 
int c = 10; 
a. 三 5 
b=c+a; 
break; 
} 
} 
printf("a = %d, b = %d\n", a, b); 
switch(b) 
{ 
// 在 switch 语 句 块 中 可 以 放 其 他 表达 式 或 声明 对 象 ， 在 这 里 的 表达 式 都 不 会 被 执行 ， 
// 因为 switch 语 句 块 中 上 (执行 匹配 switch 表 达 式 的 case 标 签 下 的 语句 
// 或 default 标 签 下 的 语句 。 因 此 不 建议 在 switch 语 句 块 中 使 ] 除 case 或 
// default 标 签 语句 之 外 的 其 他 语句 
int c = 0; // 这 里 声明 了 switch 语 句 块 作用 域 的 对 象 c， 但 c 不 会 被 初始 化 为 9 
printf("c = %d\n", c); // 这 里 的 打印 语句 不 会 被 执行 
case 1: 
defauilt: 
c = 10; // 此 语句 在 这 里 是 合法 的 ， 因 为 c 没 有 被 声明 在 case 或 default 标 签 下 
break; 
case 11: 
C ="2 
a += C) 
b -= c; 
break 
printf("a = %d, b = %d\n", a, b) 
// 空 switch 选 择 语 句 
switch(a); 
switch(a) 
// case 标 签 下 的 空 语句 
case 0: 


了 


// _ default 标签 下 的 
default: 


了 


空 语 


名 


正如 各 位 在 代码 清单 8-4 中 所 见 ，switch-case 的 用 法 非常 灵活 ， 但 
也 充满 了 各 种 限制 。 这 里 建议 各 位 使 用 一 些 常 规 的 用 法 ， 避 免 在 
switch 语 句 块 作用 域 下 声明 临时 对 象 ， 更 不 要 在 非 case 标 签 语句 下 使 用 
任何 表达 芭 % 


以 上 就 介绍 完了 C 语 言 中 的 所 有 选择 语句 ， 下 面 我 们 将 开始 介绍 C 
语言 中 用 于 表示 循环 执行 的 迭代 语句 ， 包 括 while、do-while 和 for 语 
句 。 


8.5” while 与 do-while 迁 代 语 名 


C 语 言 中 ， 如 果 我 们 想 要 循环 迭代 地 执行 一 系列 语句 ， 那 么 我 们 
束 要 用 a 到达 代 语 句 。 我 们 本 小 市 将 先 来 介绍 while 与 do-while 迭 代 语 
有 


while 语 句 的 一 般 表 达 形 式 为 : 


while ( 表达 式 ) 语句 ， 


表示 如 末 表 达 式 的 值 为 真 ， 那 么 执行 语句 ， 等 到 语句 执行 完 之 
后 ， 再 去 判断 表达 式 的 值 ， 直 到 表达 式 的 值 为 假 时 跳出 当前 循环 。 
8-2 展 示 了 while 迭 代 语 句 的 执行 流程 。 


while 表 达 式 
是 否 为 真 


图 8-2” ”while 迭代 语句 的 执行 流程 


图 8-2 简 单 明 了 地 展示 了 while 和 迭代 语 名 的 整个 执行 流程 。 当 进入 
while 语 句 之 后 就 开始 判断 其 表达 式 是 否 为 真 ， 如 果 为 真 ， 则 执行 其 循 
环 语句 (处 理 1) 。 执 行 完 处 理 1 之 后 再 立刻 回 到 while 表 达 式 处 继续 判 
断 ， 当 表达 式 的 值 为 假 时 才 跳 出 循环 执行 处 理 2。 


代码 清单 8-5 列 出 while 的 一 些 使 用 方法 以 及 一 些 注 意 事 项 。 


代码 清单 8-5 ”while 迭代 语句 的 使 用 


#include <stdio.h> 
#include <stdbool.h> 


int main(int argc, const char * argv[]) 


int a= 0, b= 10, c= 5; 


H 


// 这 里 while 语 句 的 判别 条 件 为 c > 909， 也 就 是 说 ， 当 对 象 c 大 于 0 时 执行 while 语 句 二 
// 中 的 语句 ， 否 则 跳出 整个 while 循 环 语句 块 
while(c > 0) 


at+，; 
b--; 
Cc--} 


// 执行 完 上 面 三 条 语句 之 后 ， 再 次 回 到 while(c > 90) 处 


} 


// 当 c > 0 为 假 时 ， 跳 出 整个 while 循 环 语句 块 
printf("a = %d, b = %d, c = %d\n", a, b, c); 


// 这 里 使 用 rue 表 示 while 迭 代 语 句 表 达 式 总 是 为 真 。 这 里 就 是 通常 所 说 的 “无 限 循环 " 
while(true) 


// 由 于 while 语 句 表达 式 的 判别 条 件 总 是 为 真 ， 因 此 它 将 会 一 直 循环 下 去 ， 
// 此 时 ， 我 们 可 以 通过 加 入 if 选择 语句 进行 判断 ， 
// 然后 使 用 break 晶 t 转 语 名 来 跳出 整个 while 循 环 
if(b == 0) 

break; // 这 里 当 b == 0 为 真 时 ， 使 用 break 跳 出 整个 循环 


} 
printf("a = %d, b = %d\n", a, b); 


while(c < 5) 


a++， 
if(a == 11) 
// continue 跳 转 语句 用 于 while 循 环 语句 块 中 ， 
// 表示 直接 跳 转 到 while 语 句 的 判别 表达 式 处 ， 而 不 执行 以 下 语句 。 
// 因此 这 里 当 a 的 值 为 11 时 ， 则 不 执行 下 面 两 句 ， 而 直接 继续 判断 c < 5 
continue; 
} 
b++ 
C++ 
} 
printf("a = %d, b = %d, c = %d\n", a, b, c); 
// 下 面 举 一 个 比较 实用 的 例子 ， 将 给 定 的 一 个 数组 中 的 元 素 进行 倒序 排 语 


、 


// 将 array 中 元 素 进行 倒序 排序 
int array[] = { 1, 2, 3, 4, 5 }; 


// 先 获 取 数 组 长 度 


int length = sizeof(array) / sizeof(array[90]); 


// 本 量 a 作 为 索引 
a 
// 判 晰 当前 索引 是 否 小 3 长 度 的 一 半 ， 如 果 小 于 长 度 的 
while(a < length / 2) 


{ 
// 交换 数组 首尾 两 个 元 素 
int temp = array[a] 
array[a] = array[length - 1 - al; 
array[length - 1 - al = temp; 


| 


E 则 执行 循环 


// 索引 递增 
ar++ ， 


} 


printf("array elements: "),; 

// 我 们 这 里 使 用 循环 将 数组 array 中 的 元 素 打 印 
a= 0); 

while(a < 5) 


压 
| 
让 | 


printf("%d ", array[al]); 
a++， 


} 
// 输出 一 个 换行 符 
puts(""); 


// 一 条 空 while 语 句 
while(a > 100); 


// while 与 if 类 似 ， 后 面 可 跟 一 条 语句 
while(b > 0) 
b 


= 


EE 


// 有 时 ， 我 们 为 了 能 将 某 些 语句 每 次 都 能 放 在 循环 判断 之 前 执行 ， 
// 可 以 利用 逗号 表 达 式 来 实现 这 个 效果 。 

// 这 里 每 ei. 先 执行 b+=2; a-=2;， 然 后 再 判断 c > 9 的 结果 
while(b += 2, a -= 2, c > 0) 


printf("a = %d, b = %d\n", a, b); 


c--; 


代码 清单 8-5 中 还 介绍 了 continue 与 break 这 两 种 跳 转 语 句 在 while 循 
环 体 中 的 用 法 。continue 用 于 直接 跳 转 到 while 表 达 式 处 做 判别 执行 
而 break 则 表示 跳出 当前 循环 体 。 


下 面 我 们 来 介绍 一 下 do-while 循 环 语 句 。do-while 的 表达 形式 为 : 


do 语句 while ( 表达 式 ) ， 


do-while 与 while 十 分 类 似 ， 但 不 同 的 是 : do-while 和 完 执行 循环 逻 
辑 ， 然 后 再 通过 while 来 判断 当前 表达 式 的 真 假 情 况 。 因 此 其 执行 流程 
就 如 图 8-3 所 示 。 


8-3 do-while 语 句 的 执行 流程 


图 8-3 中 ， 处 理 1 束 好 比 是 do{} 中 的 语句 块 ， 当 表达 式 为 真 时 ， 执 
行 流 直接 跳 转 到 处 理 1 中 继续 迭代 执行 ， 直 到 while () 中 的 表达 式 的 
结果 为 假 ， 则 跳出 整个 循环 ， 顺 序 执行 循环 外 的 逻辑 。 


代码 清单 8-6 描 述 了 do-while 的 使 用 方式 以 及 相应 的 一 些 特性 。 


代码 清单 8-6 do-while 循 环 的 使 用 


#include <stdio.h> 
#include <stdbool.h> 


int main(int argc, const char * argv[]) 


int a= 0, b= 10, c= 5; 


// 这 里 使 用 do-while 循 环 


// 以 下 三 句 话 必定 会 先 执行 一 次 


} 
while(a < 5); 。 // 然后 判断 a < 5 的 结果 ， 如 果 为 真 则 继续 执行 do 里 的 语句 


// 上 述 循 环 一 共 执行 了 5 次 
printf("a = %d, b = %d, c = %d\n 


5 ay b, c); 


do 
{ ; 
// 在 do 语句 块 中 声明 的 对 象 ， 在 其 外 部 不 可 被 访问 
int tmp = a+1; 
a--, 
b += tmp; 
C- -7 
} 


// 这 里 在 while 表 达 式 中 就 不 能 引用 tmp 对 象 


while(a > 1); 
printf("a = %d, b = %d, c = %d\n 
do 


{ 
b--; 


Re ay b, c); 


// 在 do 语句 块 中 使 用 continue 则 
// 而 不 执行 continue 之 后 的 语句 
if(b == 20) 

continue; 


at+， 


// 在 do 语句 块 中 使 用 break 效 果 与 while 语 句 块 相同 ， 都 是 跳出 


if(a == 5) 
break; 


接 跳 转 到 while 表 达 式 处 ， 


while(c--，true);  // 这 里 同样 可 使 用 逗号 表达 式 


// 以 上 ，b- -执行 了 5 次 ， 而 a++ 与 Cc- - 则 # 
printf("a = %d, b = %d, c = %d\n 


接 跟 一 条 


// do 语句 与 if 语 句 类 似 ， 后 面 
do 


a--, 
while(a > 0); 


I 行 了 4 次 
2 av b, c); 


语句 


// 空 的 do 语句 。 各 位 要 注意 的 是 ，do 语 句 后 面 必须 跟 while 语 句 


do; 
while(false),; 


do 
{ 


at+， 


// 在 循环 内 还 可 藤 套 循环 
while(b > 10) 
{ 


b--; 
C++ ，; 


// 这 里 的 break 语 句 仅仅 跳出 当前 的 while(b > 10) 循 环 ， 
// 而 不 是 外 部 的 do -while 循 环 


if(c == 10) 


ils 


前 循环 体 


break; 


} 
} 
while(a < 5); 


printf("a = %d, b = %d, c = %d\n", a, b, c); 


while 与 do-while 循 环 介绍 完了 ， 下 面 我 们 将 介绍 for 迭 代 语 句 。 


8.6 ”fori 关 代 语 名 


for 从 代 语 句 的 表达 形式 为 : 


for ( 子 表达 式 1; 表达 式 2; 表达 式 3 ) 语句 


其 中 ， 子 表达 式 1 可 以 是 一 个 声明 ， 也 可 以 是 一 个 表达 式 。 如 果 它 
征 一 个 声明 ， 那 么 在 这 里 声明 的 对 象 可 在 整个 循环 体 中 访问 。 子 表达 
式 1 在 整个 循环 开始 时 执行 一 次 ， 后 续 的 迭代 都 不 会 被 执行 。 表 达 式 2 
征 一 个 控制 表达 式 ， 用 于 判定 循环 执行 条 件 是 否 满足 ， 如 采 表 达 式 2 的 
计算 结果 为 真 ， 则 执行 循环 ， 人 否则 退出 当前 for 循 环 。 表 达 式 3 则 是 在 
每 执行 完 一 次 达 代 之 后 执行 一 次 。 在 每 次 迭代 结束 后 ， 总 是 先 执行 表 
达 式 3， 然 后 再 执行 表达 式 2 判断 是 否 继 续 循 环 ， 如 果 可 继续 循环 则 继 
续 执行 循环 语句 。 


这 里 ， 子 表达 陈 1 与 表达 式 3 可 缺 省 。 如 且 航 达 式 2 缺 和 省， 那么 循环 
条 件 总 是 为 真 。 


图 8-4 描 述 了 for 和 迭代 语句 的 执行 流程 。 


下 面 我 们 将 通 


循环 外 语句 


表达 式 1 


图 8-4 for 语句 执行 流程 


及 一 些 细 市 问题 。 


代码 清单 8-7 for 


迭代 语句 的 使 用 


过 代码 清单 8-7 进 一 步 介 绍 for 送 代 语 句 的 使 用 方法 以 


#include <stdio.h> 


int main(int argc, const char * argv[]) 


int a= 0, b=5, c= 10; 


// 这 里 for 里 的 子 表 达 式 1 是 一 个 声明 ， 它 声 
// 表达 式 2 是 关 
这 里 声明 的 


// 


打工 的 值 是 否 小 于 5， 
i 仅 对 


3 


fx 
3 


果 小 于 5 则 进行 循 


明了 对 象 i 并 初始 化 为 @; 
不 ， 否 则 跳出 循环 ; 


// 表达 式 3 是 i++; 在 每 次 迭代 时 ， 
for(int i = 0; i < 5; i++) 
printf("i = %d\n", i), a++; 


// 上 壕 循环 语句 a++; 被 执行 了 5 次 


printf("a = %d\n", 


+++ 


a); 
// 这 条 语句 错误 ， 标 识 符 i 在 当 


前 for 的 循环 语句 可 见 ， 对 循环 语句 外 部 的 作用 域 不 可 见 
当 循环 语句 a++; 执行 完毕 后 执行 一 次 I++， 


前 main 函 数 的 语句 块 作 


用 域内 不 可 见 ! 


个 表达 式 
站 a+ +) 


Pe 
printf("b + c = %d\n", b + c); 


\， 它 将 9 赋值 给 对 象 a 


// 这 里 的 for 语 句 缺 省 
for(; C < 10; ) 
{ 


a--, 
C++， 
printf("c = %d\n", c); 


中 缺 省 


Jfor 语 句 


了 子 表 达 式 1 与 表达 式 2， 
为 : a == 3? puts("continue reached!") : 


子 表达 式 1 与 表达 式 3， 仅 存在 控制 表达 式 2 


因此 表达 式 2 条 件 


当 a 等 于 3 时 ， 执 行 输出 命令 ， 


王 何 动 作 ， 相 当 


否则 不 做 作 


条 空 语 句 


for(; ; a == 3? puts("continue reached!") : 


当 a 


// 当 等 于 3 时 执行 continue 语 句 句 ， 
// 然后 再 判定 表达 式 2 的 结果 (这 里 
If(a == 3) 

continue 


b++; 


if(b == 10) 
break; 


// 当 b 等 了 


printf("a + b+ c = %d\n", 


} 


// for 后 面 跟 空 语句 
for(a = 0, b = 0; 


a < 10,; at+t, 


= %d\n", a, b); 


printf("a = %d, b 


代码 清单 8-7 列 出 了 各 种 对 for 适 


当 在 for 循 环 体 内 使 用 continue 跳 转 语句 时 ， 
式 3 的 位 置 ， 而 不 是 直接 去 做 表达 式 2 的 判定 。 


做 表达 式 2 的 判定 。 


从 而 跳 过 之 后 的 语句 重庆 


为 true) 


b++); 


EF 何 事情 ， 


(void)0) 


等 于 10 时 ， 跳 出 整个 for 循 环 


a+b+c); 


失 代 语句 的 用 法 。 


为 真 。 
(void)0 
(void)6 是 一 条 void 表 ; 


[Bs 
入 


折 跳 转 到 for 的 表达 式 3， 


这 里 需要 注意 的 


控制 流 是 
等 表达 式 3 执行 完成 后 再 


跳 转 到 表达 


8.7 goto 语 人 句 


在 C 语 言 中 ， 把 goto、continue、break、return 这 4 种 语句 统称 为 跳 
转 语句 (jump statements) 。continue 与 break 语 句 ， 我 们 之 前 在 讲述 
switch 选 择 语句 以 及 循环 语句 的 时 候 已 经 介绍 了 。continue 仅 用 于 循环 
语句 中 ， 在 while 与 do-while 中 表示 直接 跳 转 到 while 循 环 条件 人 处， 在 for 
循环 体 中 表示 跳 转 到 表达 式 3 处 。 而 break 在 case 语 句 中 表示 退出 当前 
switch 内 的 执行 ， 用 在 循环 体内 表示 退出 当前 循环 执行 。retum 语 句 用 
于 函数 返回 ， 我 们 将 在 下 一 章 进行 介绍 。 本 布 主要 介绍 goto 语 句 。 


goto 语 句 相当 于 处 理 器 中 的 一 条 分 支 指令 (比如 jump 、branch 
等 ) ， 这 条 语句 也 表征 了 C 语 言 与 计算 机 硬件 架构 非常 贴 合 。 尽 管 现 
代 各 种 面向 对 象 的 编程 语言 都 不 文 持 goto 语 句 ， 也 有 不 少 开发 者 对 
goto 语 句 进行 各 种 冷 哮 热 讽 ， 但 只 要 使 用 得 当 ，goto 确 实 也 是 一 个 非 
常 不 错 的 编程 语法 工具 。 


C 语 言 中 要 使 用 goto 语 句 ， 后 面 必须 加 一 个 标签 名 (lable) 。 我 们 
可 以 在 一 个 函数 中 几乎 任意 位 置 添 加 一 个 标签 。 标 签 与 对 象 不 一 样 ， 
当 出 现 一 条 goto 语 名 时， 即便 goto 指 定 的 那个 标签 在 当前 goto 语 句 之 前 
未 曾 出 现 也 没关系 ，goto 人 允许 问 下 跳 转 。 正 因为 goto 语 句 十 分 灵活， 
所 加 的 限制 很 小 ， 所 以 也 很 有 可 能 会 出 现 一 些 问 题 ， 比 如 跳 转 到 茶 一 


位 置 ， 而 在 该 位 置 处 所 引用 到 的 对 象 未 被 初始 化 ， 这 就 可 能 产生 不 可 
预期 的 运行 结果 。 因 此 我 们 在 使 用 goto 语 句 的 时 候 要 确保 当前 可 见 的 
对 和 象 都 被 正确 初始 化 了 。 


代码 清单 8-8 展 示 了 goto 语 句 的 一 些 用 法 以 及 一 些 需 要 注意 的 地 


方 。 


代码 清单 8-8 ”goto 语 句 的 使 用 


#include <stdio.h> 


int main(int argc, const char * argv[]) 


int a = 0; 
a++， 
// 如 果 a 大 了 
if(a > 0) 

goto NEXT; 


F9， 则 跳 转 到 NEXT 标 签 后 的 语句 


// 这 里 的 a- - ;被 跳 过 执行 


a--, 


NEXT: 


// 跳 转 到 此 循环 


for(int i = 0; i < 5; i++) 


a 


+= 工 ; 


// 如 果 a > 5， 
if(a > 5) 
goto NEXT2; 


则 跳出 此 循环 ， 到 NEXT2 标 签 后 面 的 语句 


printf("a = %d\n", a); 


int b 


// 如 到 


= 10; 


Ra 与 b 的 和 大 了 


if(a + b < 20) 
goto NEXT; 


// 若 a > 90， 则 跳 转 到 NEXT3 标 签 后 的 语句 处 
if(a > 0) 
goto NEXT3 


F20， 则 跳 转 到 NEXT 下 的 for 循 环 语句 处 


int c = 10; 


NEXT3: 
// 这 里 要 注意 的 是 ， 如 果 跳 转 到 此 处 ， 之 前 对 对 象 c 的 初始 化 就 不 会 执行 ， 
// 所 以 此 时 c 的 值 是 不 确定 的 
printf("c = %d\n", c); 


goto FINISH, 


FINISH: 
// 一 个 标签 后 旧 必须 跟 一 条 语 ] ， 
// 这 里 个 空 语句 (分 号 ) 来 表示 
/ 


} 


代码 清单 8-8 列 出 了 各 种 对 goto 语 句 的 使 用 方式 ， 包 括 疝 前 跳 转 和 
加 后 跳 转 ， 从 循环 语句 中 跳出 ， 等 等 。 另 外 ， 还 展示 了 一 次 跳 转 可 能 
会 引发 对 象 值 不 确定 的 情况 。 各 位 在 使 用 goto 时 应 当 注 意 这 些 问题 。 


另外， 为 了 编写 一 个 结构 民 好 的 代码 ， 在 很 多 时 候 我 们 都 避免 使 
用 goto 语 句 。 下 面 我 们 列举 一 个 使 用 do-while 语 句 来 实现 类 似 goto 语 句 
效果 的 代码 ， 如 代码 清单 8-9 所 示 。 


代码 清单 8-9 可 替代 goto 语 名 的 代码 示例 


#include <stdio.h> 
#include <stdbool.h> 


int main(int argc, const char * argv[]) 


int a=0, b=1,c= 2,; 


// goto 语 句 效果 如 下 : 
if(a < 0) 
goto FINISH ， 


printf("a = %d\n", a); 


if(b < 0) 
goto FINISH; 


printf("b = %d\n", b); 


if(c < 0) 
goto FINISH,; 


printf("c = %d\n", c); 


FINISH : 


if(a <0 ||b<0||c < 0) 
puts("Error"); 


// 使 用 do-while 来 实现 上 述 代 码 效 果 : 


do 
{ 
if(a < 0) 
break; 
printf("a = %d\n", a); 


if(b < 0) 
break; 


printf("b = %d\n", b); 


if(c < 0) 
break; 


printf("c = %d\n", c); 
} 
while(false); 


if(a <0 ||b<0||c < 0) 
puts("Error"); 


代码 清单 8-9 列 举 了 常用 错误 处 理 的 方法 。 我 们 看 到 ，if 语 句 与 
goto 语 句 联 用 能 比较 方便 地 处 理 因 某 些 参数 错误 而 需要 进一步 处 理 的 
逻辑 。 然 而 ， 我 们 有 时 也 可 以 用 do-while 同 样 简洁 地 表达 这 一 逻辑 。 
当然 ， 如 有 果 是 在 多 层 舱 套 的 循环 中 要 跳 转 出 整个 循环 ， 这 时 还 不 如 
goto 来 得 直接 。 根 据 当 前 上 下 文 我 们 可 以 选择 比较 得 体 的 解决 方案 ， 
同时 这 里 也 建议 尽量 避免 使 用 goto 语 句 ， 但 如 果 需 要 花 很 大 力气 、 写 
不 少 元 余 代 码 才能 避免 goto 的 话 ， 有 时 还 不 如 直接 用 goto 来 得 更 体面 


一 些 


8.8 本章 小 结 


本 章 介绍 了 C 语 言 中 所 有 的 控制 流 语 多， 包括 选择 语句 、 循 环 语 
句 以 及 跳 转 语句 (return 语句 将 放 在 下 一 章 详细 描述 ) 。 这 些 通常 也 是 
一 个 计算 机 程序 的 执行 顺序 控制 模式 。 当 然 ， 对 于 计算 机 处 理 需 的 执 
行 而 言 ， 它 往往 只 有 跳 转 指令 ， 而 结构 化 的 分 文 、 循 环 是 高 级 语言 对 
机 器 执行 的 一 种 高 层 抽 象 ， 使 得 高 级 语言 编写 的 程序 更 易 读 。 


下 一 章 ， 我 们 将 介绍 更 高 级 、 更 具 模 块 化 的 分 


章 ， 辆 数 。 
当 各 位 把 函数 学 完 后 ， 整 个 C 语 言 的 语法 框架 束 掌 握 得 差不多 了 。 


第 9 划 ”C 语 言 的 函数 


我 们 在 第 8 章 介绍 了 C 语 言 中 几 种 基本 的 控制 流 语句 。 但 是 为 了 使 
一 个 C 语 言 程 序 写 出 更 恨 好 的 结构 化 、 模 块 化 的 代码 ， 我 们 需要 借助 
函数 (function) 。 


在 前 儿 个 对 市 中 我 们 在 不 少 示例 代码 中 调用 了 一 些 库 函数 ， 比 如 
memcpy、memset、Pprintf 等 ， 它 们 都 完成 一 些 特定 的 功能 ， 比 如 
memcpy 是 将 一 个 源 数据 缓存 空间 中 指定 长 度 的 内 容 〈 字 节 ) 拷贝 到 目 
的 缓存 。 而 printf 的 功能 则 是 将 指定 的 字符 串 输 出 到 控制 全。 因此 在 C 
语言 中 ， 一 个 画 数 古 由 大 干 语句 构成 的 用 于 完成 一 系列 功能 的 代码 
块 。 一 个 函数 可 以 有 输入 也 可 以 有 输出 。 输 入 数据 通过 参数 传递 的 方 
式 从 函数 调用 者 (function caller) 传 入 函数 内 ， 输 出 数据 则 是 由 函数 
返回 给 其 调用 者 的 操作 计算 结果 。 


这 里 自然 而 然 地 引出 了 调用 者 与 被 调用 者 (callee) 的 概念 。 所 谓 
调用 者 是 指 调用 某 一 函数 的 函数 ， 被 调用 者 则 是 当前 被 调 用 的 函数 。 
比如 ， 我 们 在 main 画 数 中 调用 printf 画 数 ， 那 么 对 于 printf 画 数 而 言 ， 调 
用 者 就 是 main 范 数 ，printf 则 是 被 调用 者 ， 而 调用 该 printf 范 数 时 所 处 的 
位 置 则 称 为 函数 调用 点 (invoke point) 。 


函数 的 执行 与 其 他 控制 流 语句 不 同 ， 在 我 们 调用 一 个 函数 时 ， 当 
被 调用 函数 执行 完 目 己 的 逻辑 之 后 会 把 控制 交还 给 其 调用 者 继续 执 
行 。 该 执行 流程 如 图 9-1 所 示 。 


程序 开始 


程序 结束 


如 图 9-1 所 示 ， 程 序 一 开始 先进 入 main 函 数 执行 语句 1， 然 后 调用 
函数 A， 在 执行 了 函数 A 之 后 将 控制 返回 给 main 函 数 ， 紧 接着 执行 main 
函数 中 的 语句 2， 最 后 退出 当前 程序 。 


图 9-1 ”函数 的 执行 流程 


本 章 将 介绍 函数 的 声明 、 定 义 、 调 用 、 参 数 传递 ， 此 外 后 续 章 
会 介绍 指 回 男 数 的 指针 以 及 对 主 画 数 的 介绍 


还 会 


9.1 函数 的 声明 与 定义 


C 语 言 中 ， 一 个 琅 数 由 返回 类 型 、 函 数 名 以 及 形式 参数 (人 简称 形 
参 ) 列表 构成 。 在 C 语 言 标准 中 ， 又 把 函数 名 称 作 为 函数 标志 
(function designator) 。 函数 声明 以 如 下 形式 表示 : 


澡 


可 类 型 函数 名 ( 形 参 列表 ) 


形 参 列表 中 ， 每 个 形式 参数 (parameter) 用 过 号 分 隔 。 比 如 : int 
foo (inta，floatb) ; 这 就 是 一 个 函数 声明 。 该 声明 给 出 了 一 个 名 为 
foo 的 函数 ， 其 返回 类 型 为 int， 其 形 参 列表 为 (inta，float b) ; 该 列 
表 声 明了 函数 foo 囊 有 两 个 形 参 ， 第 一 个 形 参 为 int 类 型 ， 第 二 个 形 参 为 
float 类 型 。 如 果 一 个 函数 不 返回 任何 值 ， 那 么 其 返回 类 型 用 void 表 
示 。 如 果 一 个 函数 不 含有 任何 形式 参数 ， 那 么 参数 列表 可 用 () 或 
(void) 来 表示 。 本 书 偏向 使 用 (void) 来 表示 不 带 任何 形 参 的 形 参 
列表 ， 因 为 这 样 函数 声明 与 函数 调用 不 容易 被 搞 混 。 在 老式 的 C 语 言 
编译 项 中 ， 人 允许 缺 省 函数 返回 类 型 ， 如 有 果 缺 省 ， 则 默认 轴 数 返回 类 型 
为 int。 但 对 于 现代 C 语 言 编译 需 而 言 ， 如 有 果 不 写 函 数 返 回 类 型 则 会 报 
出 警告 ， 尽 管 也 会 将 该 函数 的 返回 类 型 默认 作为 int 类 型 处 理 。 


一 个 函数 声明 给 出 了 该 函数 的 原型 (prototype) ， 一 个 函数 原型 
能 确定 该 画 数 的 一 个 比较 完整 的 类 型 。 如 有 果 男 数 声 明 不 作为 男 数 定义 


的 一 部 分 ， 那 么 形 参 列表 中 的 形 参 可 舍 有 不 完整 类 型 的 形 参 ， 男 外 可 
以 用 [的 来 表示 变 长 数组 类 型 ， 人 否则 每 个 形 参 都 必须 是 完整 类 型 的 。 在 
一 个 国 数 原 型 中 ， 轴 数 形 参 列 表 中 每 个 形 参 的 标识 符 可 省 。 比 如 上 述 
的 foo 函 数 可 声明 为 : 


int foo ( int, f loat ); 


函数 定义 的 一 般 形 式 为 : 


存储 类 说 明 符 可 缺 省 “返回 类 型 ” 画 数 名 ”( 形 参 列表 ) 复合 语句 


在 函数 定义 中 ， 要 么 形 参 列表 中 的 每 个 形 参 类 型 必须 是 完整 类 
型 ， 要 人 么 形 参 列表 为 空 列 表 。 返 回 类 型 也 必须 是 完整 类 型 或 void 类 
型 。 另 外 ， 存 储 类 说 明 符 只 能 用 extern 或 static， 或 者 可 缺 省 。 如 果 缺 
省 存储 类 说 明 符 ， 则 默认 为 extern。extern 存 储 类 说 明 符 表示 一 个 函数 
具有 外 部 连接 ; static 存 储 类 说 明 符 表示 一 个 函数 具有 内 部 连接 。 存 储 
类 型 说 明 符 将 在 第 11 革 详细 介绍 。 


下 面 我 们 将 通过 代码 清单 9-1 来 给 大 家 先 简 单 介 函数 的 声明 
与 定义 的 具体 C 语 言 代码 。 


代码 清单 9-1 ”函数 的 声明 与 定义 


#include <stdio.h> 


// 这 里 声明 一 个 结构 体 类 型 MyStruct， 对 它 尚未 定义 
struct MyStruct; 


// 这 里 声 明 ] 个 画 数 MyFunc， 它 具 有 静态 存储 类 返回 类 型 为 MyStruct， 
// 带 有 一 个 形式 参数 s， 其 类 型 为 MyStruct。 MyStruct 这 里 为 不 完 整 类 型 
static struct MyStruct MyFunc(struct MyStruct s),; 


// 这 接 定 义 个 函数 Foo， 它 具有 外 部 存储 类 ， 返 回 类 型 为 void， 
// 其 形 参 列表 为 空 
void Foc (vo 
puts("Hello, world!"); 
// 这 里 定义 MyStruct 结 构 体 类 型 
Struct MyStruct 
Int a; 
float b 
}; 
2 里 直接 声明 了 三 个 函数 ， 第 一 个 函数 是 int Func1i(void); 


这 

/ 第 二 个 画 数 是 int* Func2(int ); 

人 第 三 个 函数 是 int (* Func3(void)) [3]; 即 返回 一 个 int(* ) [3] 类 型 的 不 带 形 参 的 函数 。 
// 对 画 数 声明 后 但 不 定义 ， 且 不 去 实际 引用 ， 也 不 会 存在 连接 时 错误 

int Funci(void), *Func2(int), (* Func3(void))[3]; 


int main(int argc, const char * argv[]) 


{ 


// 调用 Foo 画 数 
Foo( ); 


// 这 里 调用 MyFunc 函 数 ， 给 它 传递 的 实际 参数 是 MyStruct 结 构 体 的 一 个 复合 字面 量 ， 
// 然 后 MyFunc 所 返回 的 MyStruct 结 构 体 对 象 赋值 给 s 对 象 

Struct MyStruct s = MyFunc((struct MyStruct){10, 1.5f}); 
printf("s.a = %d, s.b = %f\n", s.a, Ss.b); 


} 


// 这 里 定义 函数 MyFunc， 这 里 MyStruct 已 经 是 完整 类 型 了 
static struct MyStruct MyFunc(Struct MyStruct s) 


return (struct MyStruct){ s.a + 10, s.b - 0.5f }; 


代码 清单 9-1 中 我 们 看 到 先 声明 了 一 个 MyFunc， 然 后 定义 了 一 个 
函数 Foo。 在 定义 函数 Foo 的 时 候 ， 其 原型 也 束 同 时 给 出 了 。 因 此 在 
main 函 数 中 ， 我 们 可 以 分 别 调用 这 两 个 范 数 。 如 琳 在 某 一 函数 中 要 调 
用 男 一 个 范 数 ， 而 所 调 画 数 的 原型 在 该 点 处 未 知 ， 那 么 编译 右 就 会 发 


出 警告 。 


在 main 函 数 中 ， 当 执行 Foo () ; 这 条 语句 时 ， 就 是 对 Foo 芳 数 进 
行 调用 ， 此 时 控制 流 会 跳 转 到 Foo 画 数 中 的 代码 进行 执行 ， 同 时 会 保 
护 当 前 上 下 文 。 等 Foo 函 数 都 执行 完 之 后 将 会 恢复 main 之 前 调用 处 的 
上 下 文 ， 然 后 把 控制 流 返 回 给 当前 的 main 函 数 ， 继 续 执 行 Foo () : 
之 后 的 代码 。 然 后 调用 了 MyFunc 函 数 ，MyFunc 函 数 构造 了 一 个 临时 
MyStruct 结 构 体 对 象 ， 将 该 对 象 初始 化 后 返回 出 去 。 在 main 函 数 中 的 
调用 端 ， 我 们 声明 了 一 个 MyStruct 结 构 体 对 象 S， 将 MyFunc 返 回 的 结 
构 体 对 象 对 它 进 行 初始 化 ， 这 样 s 的 成 员 a 被 初始 化 为 20， 成 员 b 被 初始 
化 为 1.0f 。 


9.2 ”函数 调用 与 实现 


9.1 广 主要 介绍 了 函数 的 声明 与 定义 ， 并 且 信 单 提 到 了 函数 调用 形 
式 。 本 世 将 详细 介绍 函数 调用 及 其 实现 原理 。 


像 代 码 清单 9-1 中 main 函 数 里 的 Foo () 这 一 表达 式 在 C 语 言 标准 中 
称 为 函数 调用 表达 式 。 而 Foo 后 面 的 〈) 就 是 函数 调用 操作 符 
(function call operators) ， 它 是 一 个 单 目 后 绥 操 作 符 ， 它 前 面 的 函数 
标志 束 是 一 个 后 绥 表 达 式 ， 作 为 其 操作 数 。 而 整个 畏 数 调用 表达 式 也 
是 一 个 后 绥 表 达 式 ， 后 面 圆 括号 中 可 以 不 加 任何 东西 ， 也 可 以 添加 一 
组 用 逗号 分 阳 的 表达 式 ， 这 组 表达 式 也 称 为 指定 画 数 实 参 的 表达 式 列 
表 。 一 个 实 参 〈 即 实际 参数 ，actual argument， 人 简称 argument) 可 以 是 
任 一 完整 对 象 类 型 的 表达 式 。 在 函数 调用 之 前 ， 所 有 实 参 都 要 完成 计 
算 ， 并 且 赋 值 给 对 应 形 参 。 函 数 的 每 个 形 参 ， 在 该 函数 被 调用 时 都 需 
要 有 一 个 实 参与 之 对 应 。 所 以 这 里 实 参 与 形 参 的 概念 十 分 容易 区 分 : 
实 参 是 属于 函数 调用 者 的 对 象 ， 然 后 传递 给 函数 被 调 者 ， 而 形 参 臣 属 
于 璇 数 被 调 者 的 。 


这 里 束 涉 及 了 圆 括号 出 现在 表达 式 中 的 所 有 各 类 情况 一 一 如 来 圆 
括号 中 放 的 是 类 型 名 ， 那 么 此 时 圆 括号 扮演 的 投射 操作 符 的 角色 ; 如 
末 圆 括号 中 是 一 个 表达 式 ， 并 且 前 面 含有 一 个 表示 芳 数 标志 的 表达 式 、 

(包括 指向 函数 的 指针 ) ， 那 么 此 时 圆 括 号 扮演 的 是 函数 调用 操作 符 


的 角色 ; 如 采 圆 括号 中 存放 的 是 一 个 表达 式 ， 并 且 前 面 没 有 表示 函数 
标志 的 表达 式 ， 那 么 此 时 加 括号 扮演 的 束 古 圆 括号 操作 符 的 角色 。 


9.2.1 函数 调用 的 顺序 点 


这 里 各 位 要 注意 的 是 ， 在 对 函数 标志 〈 即 函数 名 ) 计算 与 对 实 参 
计算 之 后 、 在 函数 实际 调用 之 前 ， 有 一 个 顺序 点 。 但 是 ，C 语 言 标准 没 
有 说 函数 标志 的 计算 与 对 实 参 的 计算 之 间 有 顺序 点 ， 因 此 对 函数 标志 
的 计算 与 对 实 参 的 计算 谁 先 谁 后 是 不 确定 的 。 下 面 用 代码 清单 9-2 来 举 
一 个 简单 的 例子 进行 说明 。 


代码 清单 9-2 ”函数 调用 过 程 中 的 顺序 点 


#include <stdio.h> 
static void Funci(int a) 


printf("f1i a = %d\n", a); 


static void Func2(int a) 


printf("f2 a = %d\n", a); 


static void Func3(int a, int b) 


printf("b - a = %d\n", b - a); 


int main(int argc, const char * argv[]) 


// 这 里 借助 一 个 指向 函数 指针 的 数组 对 象 来 表明 一 个 函数 标志 。 
// 这 样 ， jpFuncs [了 作为 函数 标志 符 的 计算 就 能 体现 出 来 了 
void (*pFuncs[2])(int) = {&Func1，&Func2 }; 


Se 


int i = 0; 


// 这 里 编译 器 会 发 出 警告 ， 因 为 pFuncs[i++] 的 计算 与 i 的 计算 是 未 确定 顺序 的 
pFuncs[i++] (i); 


// 这 蛙 编 详 活 会 发 出 敬 告 ， 因 为 pFuncs[i] 的 计算 与 ++i 的 计算 是 示人 确定 顺序 的 
pFuncs[I](++I) ， 


// 这 里 编译 器 会 发 出 警告 ， 因 为 第 一 个 实 参 的 计算 与 第 二 个 实 参 的 计算 是 未 确定 顺序 的 
Func3(i++, i); 


代码 清单 9-2 引 入 了 将 在 9.8 广 中 介绍 的 指 辐 函数 的 指针 语法 ， 这 里 
先 借助 一 下 用 来 表明 对 函数 标志 的 计算 顺序 问题 。 这 里 各 位 可 以 看 
到 ， 无 论 古 贸 数 标志 的 计算 还 古 实 参 列表 中 对 每 个 实 参 的 计算 ， 它 们 
之 间 都 没有 顺序 点 。 


没有 顺序 点 有 何 好 处 ? 现代 高 级 一 点 的 处 理 器 都 具有 超标 量 流水 
线 (superscalar pipeline) 以 及 无 序 执行 引擎 〈outrof-order execution 
engine) ， 使 得 处 理 器 对 多 条 前 后 没有 依赖 关系 的 指令 进行 并 行 执行 ， 
这 也 被 称 为 指令 级 并 行 (Instruction-Level Parallelism，ILP) 。 我 们 以 
代码 清单 9-2 为 基础 ， 写 一 条 pFuncs[i+1] (i-1) ; 函数 调用 表达 式 语 
句 ， 那 么 汇编 指令 可 能 是 这 样 的 〈 基 于 ARMvVv7 架 构 指 令 集 ) : 


ldr R1, =i,; 

adr R12, pFuncs; 

add R12, R12, R1i, lsl #2; 
sub RO, R1, #1; 

ldr R12, [R12, #4]; 

blx R12; 


第 1 条 指令 是 将 变量 i 的 内 容 读 取 到 R1 寄 存 右 中 ; 


第 2、3 条 指令 则 是 将 R12 寄 存 需 指 和 同 pFuncs 数 组 的 第 ji 个 元 素 的 地 
址 ; 


第 4 条 指令 是 将 i-1 的 值 作 为 第 一 个 实 参 的 值 ; 


第 5 条 指令 则 完成 了 对 整个 pFuncs[i+1] 的 计算 ， 获 得 了 当前 要 调用 
的 函数 指针 的 值 ; 


第 6 条 指令 做 函数 调用 。 


这 里 ， 第 1、2 条 指令 没有 依赖 关系 ， 因 此 可 并 行 执行 ， 第 3 条 指令 
因为 动用 了 寄存 器 移 位 操作 加 算术 操作 ， 本 身 比较 复杂 ， 因 此 一 般 无 
法 与 其 他 指令 做 并 行 执 行 了 ; 第 4、 第 5 条 指令 之 间 也 不 存在 相互 依 
赖 ， 可 并 行 执行 。 由 此 我 们 可 以 看 到 ， 不 安插 顺序 点 对 于 现代 处 理 器 
的 加 速 执行 而 言 是 非常 有 好 处 的 。 而 处 理 器 在 做 诸如 函数 调用 等 分 文 

站 令 时 ， 目 然 会 清算 之 前 相关 计算 的 副作用 〈 包 括 对 函数 标志 的 计算 

以 及 实 参 的 计算 ) 。 因 此 ， 我 们 在 涉及 不 指定 顺序 点 的 表达 式 语句 

中 ， 不 要 在 整 条 语句 中 出 现 对 同一 对 象 做 产生 顺序 点 副作用 的 操作 
(比如 自 增 、 自 减 操 作 ) 。 


下 面 通过 代码 清单 9-3 对 代码 清单 9-2 进 行 改进 ， 来 说 明 如 何 避 免 代 
码 清单 9-2 中 所 产生 的 警告 问题 。 


代码 清单 9-3 ”避免 产生 顺序 点 副作用 


#include <stdio.h> 
static void Funci(int a) 


printf("f1i a = %d\n", a); 


static void Func2(int a) 


printf("f2 a = %d\n", a); 


static void Func3(int a, int b) 


printf("b - a = %d\n", b - a); 


int main(int argc, const char * argv[]) 

void (*pFuncs[2])(int) = { &Funci, &Func2 }; 
int i = 0; 

pFuncs[i](i + 1); I++， 

pFuncs[i](i + 1); i++ 

Func3(i, i + 1); I++， 

/7 或 
i = 0; 
int j = 0; 


// 由 于 i 与 j 是 两 个 不 同 的 对 象 ， 因 此 这 里 不 会 引发 顺序 点 的 冲突 问题 
pFuncs[j++] (++i); 


pFuncs[j++] (++i); 


Func3(j, ++i); 


上 面 我 们 讲述 了 函数 调用 的 基本 形式 以 及 实 参 、 男 数 标 总 的 计算 
与 函数 调用 之 间 的 顺序 点 。 下 面 我 们 将 讲述 函数 调用 执行 的 细节 。 尽 
管 C 语 言 标准 没有 规定 函数 执行 的 过 多 细节 ， 这 是 由 于 这 样 可 以 让 各 种 
编译 天 针对 当前 运行 环境 有 更 多 更 目 由 灵活 的 实现 方式 ， 不 过 我 们 通 
过 对 函数 内 部 执行 细 市 的 学 习 可 以 更 深入 透彻 地 理解 C 语 言 函 数 的 整个 
概念 。 


正如 上 文 所 描述 的 ， 对 一 个 函数 的 调用 要 经 历 三 个 步 又， 前 两 个 
步 又 分 别 是 对 函数 标志 表达 式 的 计算 以 及 对 函数 实 参 的 计算 ， 这 两 步 
之 间 不 分 先后 顺序 ， 最 后 是 对 函数 进行 调用 。 把 实际 参数 传递 到 函数 


形式 参数 的 实现 是 由 各 个 处 理 右 以 及 系统 环境 决定 的 ， 这 里 涉及 函数 
调用 约定 ， 此 内 容 将 在 第 15 章 做 详细 介绍 。 


9.2.2 ” 琴 数 的 栈 空 间 


对 于 大 部 分 处 理 器 以 及 操作 系统 环境 而 言 ， 每 个 函数 都 具有 上 自己 
独立 的 上 下 文 存储 空间 ， 此 存储 空间 往往 是 栈 式 存储 的 ， 所 以 又 被 称 
为 栈 (stack) 空间 。 相 应 地 ， 一 般 处 理 器 会 有 一 个 专用 的 栈 指针 寄存 
器 (Stack Pointer Register， 一 般 简 称 为 SP) 用 于 存放 当前 函数 所 属 的 
栈 空间 的 地 址 。 初 始 时 ，SP 会 指向 进程 给 当前 程序 分 配 栈 空间 的 最 大 
地 址 处 。 然 后 我 们 在 函数 中 定义 一 个 局 部 对 象 ， 那 么 它 可 能 就 会 被 保 
存在 当前 函数 的 栈 空间 中 ， 此 时 栈 指针 SP 会 先 减 该 局 部 对 象 所 占 存 储 
空间 的 字 节 大 小 ， 然 后 将 该 对 象 的 内 容 存 放 在 此 存储 单元 内 。 我 们 观 
察 一 下 代码 清单 9-4 所 列 出 的 main 范 数 在 执行 代码 的 过 程 中 对 栈 指针 的 


要 他 


代码 清单 9-4” 栈 指针 操作 大 概 示意 代码 


int main(void) 
{ 


int a = 10; // 相当 于 SP -= 4; [SP] = 10， 
a += 20; // 相当 于 reg = [Sp]; reg += 20; [SP] = reg; 


Be ee 动 回收 
// 这 里 相当 于 : reg = [SP]; SP += 4; 


代码 清单 9-4 中 ， 注 释 里 写 的 是 处 理 器 的 部 分 汇编 指令 ， 其 中 [SP] 
表示 访问 SP 当前 所 指向 的 栈 空 间 的 内 容 ，reg 表 示 某 个 寄存 器 。 上 述 代 
码 假定 运行 在 32 位 系统 中 ， 一 个 int 类 型 的 对 象 所 占 的 存储 空间 为 4 个 字 
节 。 因 此 一 开始 SP-=4 表 示 SP 指 针 先 减 去 4 个 字 节 ， 然 后 [SP]=10 表 示 将 
常量 10 存 储 到 减 去 4 之 后 的 SP 所 指向 的 栈 空间 。 而 这 两 条 指令 〈《 即 SP- 
=4; [SP]=10) 又 被 称 为 压 栈 (push) 操作 ， 许 多 处 理 器 会 直接 用 PUSH 
站 令 助 记 符 来 表示 ， 比 如 可 以 把 这 两 条 指令 表示 为 一 条 指令 ; PUSH 
10。 随 后 ， 在 做 a+=20; 时 ， 先 获取 将 当前 SP 所 指向 的 栈 空间 地 址 值 ， 
然后 读 取 该 地 址 中 所 存放 数据 的 值 (这 里 存放 的 是 对 象 的 值 ) 加 载 到 
寄存 器 reg 中 ， 再 将 该 寄存 器 的 值 加 上 20， 最 后 把 该 寄存 器 的 值 写 入 SP 
所 指 的 栈 空 间 中 。 最 后 一 句 返 回 语句 则 是 将 SP 所 指 的 栈 空间 地 址 中 存 
放 的 值 加 载 到 reg 寄 存 器 中 用 于 返回 结果 ， 然 后 将 栈 指针 加 4， 即 恢复 画 
数 调用 前 的 SP 的 位 置 。 这 一 过 程 又 称 为 出 栈 (pop) 操作 ， 许 多 处 理 器 
会 直接 使 用 POP 指令 助 记 符 来 表示 ， 比 如 可 以 把 最 后 两 条 指令 表示 为 : 
POP reg。 图 9-2 展 示 了 代码 清单 9-4 中 执行 main 范 数 时 的 SP 操作 过 程 。 


图 9-2 假 定 在 系统 调用 main 函 数 时 ，SP 栈 指针 指向 0x8000 地 址 ， 并 
且 将 从 0x7000 到 0x8000 这 4KB 存 储 空 间作 为 当前 进程 的 栈 空间 。 当 执 
行 了 int a=10; 这 条 语句 之 后 ， 相 当 于 将 常量 10 压 入 栈 ， 此 时 对 象 a 的 存 
储 空间 可 看 作为 以 0x7FFC 作 为 起 始 地 址 ， 一 直到 0x7FFF， 这 4 字 市 的 
存储 单元 ， 所 以 对 象 a 的 地 址 (&a) 就 是 0x7FFC。 最 后 执行 return ai 
语句 之 后 ， 先 将 对 象 a 的 值 加 载 到 用 于 返回 值 的 寄存 器 reg 中 ， 然 后 恢复 


SP 到 初始 时 的 位 置 。 最 后 执行 RET 指 令 ， 将 被 调 函 数 所 保存 的 函数 调 
用 者 之 前 所 执行 CALL 指 令 的 下 一 条 指令 的 地 址 作为 目标 指令 地 址 进行 
跳 转 。 


10 
0 0 | 
Ox7FF4 Ox7FF4 
初始 时 执行 PUSH 10 之 后 
Ox8000 


Ox8000 SP 


Ox7FF4 Ox7FF4 
执行 a+=20 之 后 执行 POP reg 之 后 


图 9-2 ”SP 栈 指针 操作 过 程 


9.2.3” 畏 数 的 参数 传递 与 返回 


上 面 介 绍 了 对 一 个 函数 中 局 部 对 象 的 操作 ， 并 且 初 步 描述 了 处 理 
器 中 栈 指针 SP 的 工作 方式 。 而 在 调用 某 个 函数 时 ， 将 实际 参数 传递 给 


被 调 函 数 的 形式 参数 时 ， 有 时 也 需要 对 栈 空 间 进行 操作 ， 尤 其 是 对 于 
寄存 器 数量 不 多 的 处 理 器 。 一 般 会 将 被 调 函 数 的 形 参 所 在 的 栈 存 储 空 
间 分 配 在 调用 函数 的 栈 至 间 区 域 中 ， 也 融 是 说 让 函数 调用 着 负责 将 实 
参 内 容 压 栈 ， 以 此 形式 给 被 调 钞 数 的 形 参 赋值 。 倘 奉 被 调 芳 数 要 返回 
一 个 结构 体 对 象 ， 以 至 于 无 法 将 返回 内 容 保存 在 一 个 寄存 器 内 ， 那 么 
该 对 象 存放 在 被 调 函 数 的 栈 空间 中 ， 然 后 将 该 结构 体 对 象 的 首 地 址 放 
在 结果 寄存 器 中 返回 出 去 。 函 数 调用 者 需要 通过 SP 指针 将 被 调 函 数 所 
返回 的 结构 体内 容 拷 贝 到 目 己 的 栈 空间 中 去 。 


下 面 我 们 通过 代码 请 单 9-5 大 致 介绍 一 下 在 函数 中 调用 另 一 个 函数 
时 ， 在 参数 传递 以 及 获取 返回 数据 时 ， 对 栈 指针 的 操作 。 


代码 清单 9-5 ”参数 传 北 与 画 数 返回 时 的 代码 示例 


#include <stdio.h> 
struct MyStruct 
et 
int i; 
float f; 
}; 
static struct MyStruct Foo(int a, float b) 
{ 
Struct MyStruct S= {a, b}; 


Ss.i += 10; 
s.f -= 0.5f; 


return s; 


} 
int main(int argc, const char * argv[]) 
struct MyStruct s = Foo(10, 1.5f); 


printf("s.i = %d, s.f = %f\n", s.i, s.f); 


代码 清单 9-5 中 ， 在 main 函 数 中 先 用 实际 参数 10 与 1.5f 来 调用 函数 
Foo， 然 后 将 函数 Foo 所 返回 的 MyStruct 类 型 的 对 象 给 main 函 数 中 声明 
的 局 部 对 象 s 进 行 初始 化 。 这 里 ，main 画 数 称 为 函数 调用 者 (caller) ， 
而 Foo 函 数 则 被 称 为 函数 被 调用 者 (callee) 。Foo 的 形 参 都 位 于 main 画 
数 的 栈 空 间 范 围 内 ， 图 9-3 展 示 了 在 main 函 数 中 调用 Foo 函 数 前 后 栈 指 
针 的 变化 。 


SP 0x8000 0x8000 0x8000 
0x7FFC 0x7FFC Ox7FFC 
0x7FF8 0x7FF8 Ox7FF8 
Ox7FF4 Ox7FF4 Ox7FF4 
Ox7FFO Ox7FFO Ox7FFO 
0x7FEC 0x7FEC 0x7FEC 
0x7FE8 0x7FE8 0x7FE8 

进入 main 函 数 后 调用 Foo 函 数 前 传递 参数 
0x8000 0x8000 0x8000 
Ox7FFC Ox7FFC Ox7FFC 
0x7FF8 0x7FF8 0x7FF8 
Ox7FF4 Ox7FF4 Ox7FF4 
Ox7FFO 0x7FF0 Ox7FFO 

SP 0x7FEC 0x7FEC 0x7FEC 
0x7FE8 0x7FE8 0x7FE8 

调用 Foo 函 数 0x7FE4 0x7FE4 
进入 Foo 国 数 之 后 Foo 国 数 返 回 之 后 


图 9-3 ”函数 调用 时 的 参数 传递 与 返回 结 采 的 获取 


图 9-3 中 ， 在 进入 main 之 前 ， 栈 指针 SP 假定 指 癌 0x8000 这 个 地 址 。 
进入 main 之 后 ， 假 定 SP 指针 移动 到 了 0x7FF8 的 位 置 ， 这 是 为 了 给 main 
函数 中 的 局 部 对 象 s 留 出 存储 空间 。 也 就 是 说 对 象 s 的 起 始 地 址 即 为 
0x7FF8。 当 开始 调用 Foo 函 数 时 ， 先 将 实 参 10 和 1.5f 传 递 给 Foo 函 数 的 形 
参 a 和 b， 此 时 ， 先 压 入 形 参 b 的 值 ， 再 压 入 形 参 a 的 值 ， 形 参 a 的 地 址 自 
然 就 比 形 参 b 要 低 了 。 此 时 ， 形 参 a 的 地 址 为 0x7FF0， 形 参 b 的 地 址 为 
0x7FF4。 传 递 完 参数 后 ， 开 始 调 用 函数 Foo。 关 于 函数 调用 ， 有 些 处 理 
器 (比如 x86) 是 将 函数 调用 指令 的 下 一 条 指令 的 地 址 自动 压 栈 ， 而 有 
些 处 理 器 〈 比 如 ARM) 则 是 有 专门 的 连接 寄存 器 (ink register) 用 于 
存放 画 数 调用 指令 的 下 一 条 指令 地 址 。 这 里 假定 我 们 用 的 是 类 似 x86 处 
理 器 那 种 ， 将 返回 地 址 做 压 栈 操作 的 。 进 入 Foo 函 数 后 ， 跟 main 函 数 类 
似 ， 再 将 SP 栈 指针 减 8， 留 给 Foo 函 数 中 的 局 部 对 象 6。 这 样 对 象 的 起 
始 地 址 就 是 0x7FE4。 此 时 ， 我 们 从 图 中 可 以 观察 到 ， 从 栈 空间 地 址 
0x7FF0 全 0x7FFF 这 上段 存储 空间 是 属于 函数 调用 者 main 夯 数 的 区 域 ， 而 
栈 空 间 地 址 0x7FE4 到 0x7FEF 这 段 存 储 空间 是 属于 被 调 者 Foo 芳 数 的 区 
域 。 当 Foo 函 数 返回 之 后 ，SP 栈 指针 加 到 0x7FF0 处 。 此 时 ， 编 译 器 会 
动 生成 代码 ， 将 Foo 画 数 中 所 返回 的 的 局 部 对 象 。( 地 址 在 0x7FE4 处 ) 
的 首 地 址 通过 寄存 侣 返回 给 函数 调用 者 main， 然 后 在 main 芳 数 中 将 获 
得 的 Foo 所 返回 的 局 部 对 象 s 的 内 容 找 贝 到 它 自 己 的 局 部 对 象 s 中 (地 址 
在 0x7FF8 处 ) 。 在 没有 调用 另 一 个 函数 之 前 ， 所 有 之 前 调用 过 的 函数 
所 留 在 栈 空间 中 的 数据 都 会 被 保留 ， 这 样 有 助 于 做 返回 值 的 拷贝 。 但 


是 当 执行 完 main 函 数 中 的 struct MyStruct s=Foo (10，1.5f) ; 这 条 语句 
之 后 ， 我 们 就 应 该 认为 之 前 所 调用 的 Foo 函 数 在 栈 空 间 留 下 的 任何 数据 
都 已 经 无 效 了 。 此 后 ， 栈 指针 SP 会 恢复 到 0x7FF8， 即 把 之 前 压 入 的 形 
参 对 象 也 “销毁 ” 掉 。 


下 一 条 语句 是 调用 库 函 数 printf， 此 时 与 调用 Foo 函 数 类 似 ， 会 对 栈 
站 针 进行 操作 ， 先 做 参数 传递 ， 然 后 调用 printf 范 数 。 在 调用 printf 芳 数 
过 程 中 ， 之 前 Foo 芳 数 所 留 在 栈 空间 的 数据 部 会 被 printf 函 数 所 留 下 的 数 
据 给 覆盖 掉 。 也 就 是 说 ， 一 个 系统 进程 的 整个 栈 空 间 都 是 该 进程 中 所 
有 被 调 函 数 共 享 的 。 因 此 ， 栈 空间 是 一 个 可 活动 的 、 可 复 用 的 、 用 于 
存放 男 数 中 临时 产生 数据 的 存储 空间 。 


以 上 便 描 述 了 调用 一 个 函数 后 编译 器 以 及 处 理 器 大 概 会 做 的 一 些 
事情 。 看 到 这 里 ， 相 信 读 者 应 该 对 栈 这 个 概念 有 所 了 解 了 ， 并 且 对 画 
数 内 定义 的 局 部 对 象 的 生命 周期 也 有 了 大 概 的 认识 。 那 么 说 到 这 儿 我 
们 应 该 知道 ， 被 调 函 效 的 形 参与 调用 着 的 实 参 其 实 是 两 个 不 同 的 对 
象 。 画 数 调用 者 的 实 参 在 目 己 的 栈 空 间 内 ， 而 在 传递 给 被 调 函 数 时 ， 
征 将 保存 在 自己 栈 空间 的 对 象 做 压 栈 处 理 ， 拷 贝 到 被 调 函 数 可 访问 的 
栈 空间 区 域 ， 尽 管 这 部 分 区 域 仍然 属于 函数 调用 者 。 为 了 更 清晰 地 表 
达 这 一 点 ， 我 们 将 通过 代码 清单 9-6 进 行 陈述 。 


代码 清单 9-6 ”呈现 被 调 函 数 形 参与 调用 者 的 实 参 属于 不 同 对 象 


#include <stdio.h> 


static void Foo(int a) 


// 这 里 将 输出 : a address is: 00007FFF5FBFF7EC 
printf("a address is: %.16txX\n", (uintptr_t)é&a); 


a += 10; 


// 这 里 将 输出 : a = 110 
printf("a = %d\n", a); 
} 


int main(int argc, const char * argv[]) 


int x = 100; 


// 这 里 将 输出 : x address is: 00007FFF5FBFF80C 
printf("x address is: %.16txX\n", (uintptr_t)e&x); 


Foo(x); 
// 这 里 将 输 出 : x = 190 
printf("x = gd\n', x); 


通过 代码 清单 9-6 我 们 可 以 发 现 ，main 函 数 中 将 其 局 部 对 象 x 传递 给 
Foo 函 数 的 形 参 ，x 的 地 址 为 0x 00007FFF5FBFF80C， 而 Foo 形 参 a 的 地 
址 为 00007FFF5FBFF7EC， 两 者 属于 不 同 的 对 象 。 所 以 ， 即 便 在 Foo 函 
数 中 任意 修改 形 参 a 的 值 都 不 会 影响 main 函 数 中 x 对 象 的 值 。 


9.2.4 ”通过 形 参 修改 实 参 的 值 


那么 我 们 可 能 会 问 ， 如 何 通过 范 数 来 修改 钞 数 调用 者 对 象 的 值 
呢 ? 答案 很 简单 : 站 针 ! 如 果 我 们 将 函数 调用 者 的 某 个 对 象 的 地 
址 作为 实 参 传 递 给 被 调 函 数 的 形 参 〈 被 调 函 数 的 形 参 为 一 个 指针 类 型 
的 对 象 ) ， 那 么 在 被 调 函 数 中 可 利用 间接 操作 对 形 参 所 指 对 象 的 内 容 


进行 修改 。 代 码 清 单 9-7 将 通过 实现 交换 两 个 整数 实 参 值 的 函数 来 搬 述 
如 何 利用 指针 来 修改 实 参 值 。 


代码 清单 9-7 ”实现 交换 两 个 整数 对 象 值 的 函数 


#include <stdio.h> 
static void MySwapFunc(int *p, int *q) 


// temp 先 保存 形 参 p 所 指 对 象 的 值 


int temp = *p; 


参 q 所 指 对 象 的 值 赋 给 形 参 p 所 指 对 象 
*q; 


// 将 
*p = 


// 将 temp 保 存 的 值 赋 给 形 参 q 所 指 对 象 ， 这 样 正好 完成 了 整个 交换 操作 


*q = temp; 


el 


int main(int argc, const char * argv[]) 


int a = 10, b = 20; 


// 这 里 调用 MySwapFunc 了 时 ， 
// 分 别 将 对 象 a 的 地 址 与 对 象 b 的 地 址 作为 实 参 传递 给 MySwapFunc 画 数 
MySwapFunc(&a, &b); 


// 我 们 通过 打印 可 以 看 到 ， 对 象 a 的 值 与 b 的 值 两 者 被 交换 J 
printf("a = %d, b = %d\n", a, b); 


代码 清单 9-7 中 ， 通 过 将 main 芳 数 中 的 局 部 对 象 与 b 的 地 址 作为 实 
参 传 递 给 Foo 函 数 的 形 参 ， 然 后 由 Foo 函 数 通 过 对 形 参 的 间接 操作 来 实 
现 交 换 两 个 函数 调用 者 对 象 的 目的 。 像 *p=*q; 这 条 语句 执行 完 之 后 ， 
main 琅 数 中 的 对 象 的 值 束 变 为 了 20。 而 当 *g=temp; 这 条 语句 执行 完 
后 ，main 函 数 中 的 对 象 b 的 值 变 为 了 10。 


9.3 ”数组 类 型 作为 函数 形 参 


如 果 一 个 函数 的 形 参 是 一 个 数组 类 型 的 对 象 ， 那 么 它 会 被 调 整 为 
指向 该 数组 元 素 类 型 的 指针 ， 同 时 如 果 类 型 还 有 限定 符 (比如 const 、 
volatile) ， 那 么 可 以 在 表示 数组 对 象 的 [里 添加 。 如 果 在 [] 中 含有 static 
关键 字 ， 那 么 实 参 必须 确保 至 少 能 访问 该 形 参 所 指定 元 素 个 数 的 元 素 


数量 。 


对 于 一 个 纯 函 数 声 明 而 言 《 即 声明 该 画 数 之 后 不 直接 对 它 定 
义 ) ， 形 参 可 以 具有 不 完整 类 型 ， 并 且 可 以 使 用 [ 执 来 表示 变 长 数组 类 
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代码 清单 9-8 将 朱 述 这 些 特性 。 
代码 清单 9-8 ”数组 类 型 对 象 作为 钞 数 形 参 


#include <stdio.h> 


// 这 里 是 对 函数 Func1 的 声明 ， 不 对 它 进 行 定义 ， 因 此 可 用 [*] 表 示 一 个 变 长 数组 类 型 。 
// 这 里 需要 注意 的 是 ，a 的 类 型 为 int[*] ， 它 是 一 个 不 完整 类 型 
static void Func1(int a[*]); 


// 这 里 对 画 数 Func1 进 行 了 定义 ， 这 里 不 能 使 用 [*] ， 但 可 以 用 [] 。 
// 因为 int[*] 是 一 个 不 完整 类 型 ， 而 int [] 是 完整 类 型 ， | 
// a 动 转换 为 int* 。 当面 数 形 参 为 数组 类 型 时 ， | 
// 会 被 自动 转换 为 指向 该 数组 元 素 类 型 的 指针 ， 所 以 这 里 的 形 参 a 就 是 int* 类 型 
static void Funci(int a[]) 


if(a != NULL) 
printf("a[0] = %d\n", a[0]); 


// 这 里 sizeof(a) 的 大 小 就 相当 于 sizeof(int* ) 的 大 小 


printf("size of a = %zu\n", sizeof(a)); 


// 当 一 个 数组 卖 型 对 象 作为 图 数 区 参 时 ， 无 论 指定 数组 长 度 是 多 少 都 个 会 有 用 。 
// 因为 它 站 部会 被 转换 为 指 句 该 数组 元 素 类 型 的 指针 

// 这 里 的 形 参 a 也 是 int* 类 型 
static void Func2(int a[10]) 


if(a == NULL) 
puts("nil!"),; 


// 这 里 sizeof(a) 的 大 小 就 相当 于 sizeof(int* ) 的 大 小 
printf("size of a = %zu\n", sizeof(a)); 


// 这 里 用 static 表 示 调 用 Func3 时 ， 实 参 所 指定 的 数组 或 缓存 应 该 至 少 含有 5 个 Int 元素 对 象 。 
// 这 里 加 上 const 限 定 符 ， 表 示 对 形 参 a 做 了 常量 限定 ，a 不 能 指向 其 他 对 象 地 址 。 
// 因此 ， 这 里 a 的 类 型 为 int * const 

static void Func3(int a[static const 5]) 


i 


{ 
int sum = 0; 
// 对 数组 元 素 求 和 
for(int i = 0; i < 5; i++) 
sum += a[i]; 
// OK 
a[90] = 100; 
这 人 句 话 错误 : a = NULL;，a 不 能 指向 其 他 对 象 ， 即 a 的 值 不 能 被 修改 
} 
// 这 里 声明 Func4， 其 形 参 i 数组 ， 
// 其 中 a[i] 的 类 型 被 声明 为 nt[*]， 个 不 确定 个 数 的 数组 ， 
// 它 是 一 个 不 完整 类 型 


static void Func4(int a[static const 2][*]); 


// 这 里 对 Func4 进 行 定义 ， 明确 表示 a[i] 的 类 型 为 nt [3] 3 
// 对 了 | 个 函数 锈 参 类 型 为 纪 数组 类 型 的 也 类 似 ， 
// 这 里 a 的 类 型 会 被 自动 转换 为 nt (* const)[3]， 即 指向 int[3] 数 组 的 常量 指针 


static void Func4(int a[static const 2][3]) 


{ 
// 这 里 将 输出 sizeof (int[3] ) 一 样 的 大 小 
printf("size of a[0] = %zu\n", sizeof(*a)); 
// 将 a[1][2] 的 值 修改 为 29 
a[1][2] = 29; 
// 这 人 句 话 错误 : a = NULL; ，a 的 值 不 能 被 修改 

} 


int main(int argc, const char * argv[]) 


// 个 数组 字面 量 作为 人 
Func1( (int[]){ 1, 2 }); 


1 压 | 
6 


dFunc1 


/7 -这 接 用 空 值 作为 形 参 来 调用 Func2 
Func2(NULL); 


int array[] = { 1, 2, 3, 4, 5, 6 }; 


// 将 数组 array 作 为 实 参 来 调用 Func3 
Func3(array ) 


// array 的 第 一 个 元 素 被 修改 成 了 100 
printf("array[0] = %d\n", array[0]); 


int darray[][3] = { 
EB 


}; 
Func4(darray); 


// darray[1][2] 的 值 被 修改 成 了 20 
printf("darray[1][2] = %d\n", darray[1][2]); 


代码 清单 9-8 涉 及 const 限 定 符 的 问题 ， 关 于 这 个 话题 我 们 将 在 第 12 
革 详 细 描 述 ， 这 里 仅 用 来 陈述 当 数 组 类 型 作为 函数 形 参 时 可 以 如 何 表 


0 
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既然 我 们 知道 了 当 函 数 形 参 古 一 个 数组 类 型 时 ， 它 会 被 目 动 转 为 
相应 的 指针 类 型 ， 也 就 是 说 我 们 不 能 将 一 个 数组 直接 以 元 素 找 贝 的 方 
式 传递 给 函数 形 参 ， 因 此 我 们 往往 以 一 个 数组 的 某 个 元 素 的 地 址 传递 
给 修 调 函数 的 形 参 ， 然 后 可 以 再 加 一 个 参数 表示 当前 提供 数组 的 长 
度 。 代 码 清 单 9-9 给 出 了 一 个 示例 代码 ， 里 面 实现 了 给 一 个 指定 数组 的 
所 有 元 素 进 行 倒序 排列 的 函数 。 


代码 请 单 9-9 ”对 指定 数组 进行 倒序 排列 的 函数 实现 


#include <stdio.h> 


As 
* 这 里 定义 一 个 名 为 SwapArray 的 函数 ， 用 于 实现 给 指定 数组 的 所 有 元 素 进行 倒序 排列 
* @param a 指向 一 个 传 入 数组 元 素 的 地 址 ， 其 类 型 为 int* 


* @param count 用 于 指定 传 入 数组 的 长 度 ( 即 元 月 个 数 ) 
*] 


己 - 


void SwapArray(int a[], int count) 


// 这 里 只 需要 遍历 一 饥 长 度 
for(int i = 0; i < count / 2; i++) 


// 交换 数组 首尾 两 个 元 素 的 值 
int temp = al[il]; 

a[li] = a[lcount - i - 1]; 
arcount - i - 1] = temp; 


int main(int argc, const char * argv[]) 


int array[] = { 1, 2, 3, 4, 5 }; 


// 从 array 第 9 个 元 素 开 始 ， 对 所 有 元 素 进行 倒序 排 请 
SwapArray(array, 5); 


// 输出 排序 结果 
printf("Elements: "); 


for(int i = 0; i < 5; i++) 
printf("%d ", array[i]); 


puts(™"); 


// 再 从 array[1] 元 素 开 始 ， 对 它 及 后 序 元 素 进 行 倒序 排序 
SwapArray(&array[1], 4); 


// 输出 排序 结果 
printf("Elements: "),; 


for(int i = 0; i < 5; i++) 
printf("%d ", array[i]); 


puts(™"); 


通过 代码 清单 9-9， 我 们 对 如 何 将 数组 对 象 作为 实 参 传递 给 被 调 范 
数 有 了 一 些 请 晰 的 思路 。 上 述 倒序 排序 数组 元 系 的 算法 也 十 分 简单 ， 
即将 数组 第 一 个 元 素 与 最 后 一 个 元 素 进行 交换 ， 第 二 个 元 素 与 倒数 第 
二 个 元 素 进 行 交 换 ， 以 此 类 推 , 最 后 一 直到 中 间 那 个 元 素 ， 这 样 整 个 
数组 的 元 素 束 补 倒 序 排序 了 一 过 。 


9.4 ”市 有 不 定 参 数 类 型 及 个 数 的 函数 声明 与 调用 


C 语 言 男 数 的 形 参 类 型 列表 的 最 后 可 以 市 有 不 定 参 数 类 型 及 个 数 
的 形 参 列表 ， 用 (，...) 来 表示 。C 语 言 标准 明确 规定 ， 含 有 不 定 参数 
个 数 的 形 参 列 表 中 ， 必 须要 有 一 个 确定 的 命名 形 参 ， 并 且 .… 后 不 能 再 
跟 其 他 形 参 。 比 如 以 下 函数 声明 是 错误 的 : 


// 错误 ! 在 ..， 之 前 必须 至 少 要 有 一 个 命名 形 参 
void Funci1(...); 


// 错误 ! 在 ,, ， 之 后 不 能 再 跟 任何 形 参 


void Func2(int a, ..., int b); 


对 于 调用 市 有 不 定 参数 个 数 的 函数 时 所 要 传递 的 实 参 而 言 ， 由 于 
不 定 参数 列表 中 的 每 个 参数 类 型 不 确定 ， 因 此 C 语 言 编译 器 将 采用 黑 
认 的 实 参 晋升 (argument promotion) 机 制 。 也 就 是 说 ， 对 于 任何 整数 
转换 等 级 小 于 int 类 型 的 实 参 ， 其 类 型 都 将 被 置 升 为 int 类 型 ， 单 精度 浮 
点 类 型 (float) 的 实 参 将 被 晋升 为 双 精 度 浮 点 类 型 (double) 


另外 ， 当 我 们 要 实现 一 个 珊 有 不 定 参 数 个 数 的 函数 时 ， 需 要 借助 
<stdarg.h> 标 准 头 文 件 中 的 宏 来 达 代 获取 每 个 形 参 。<stdarg.h> 标 准 头 
文件 定义 了 4 个 宏 用 于 裔 历 传 入 的 实 参 列表 。 正 如 上 面 所 述 ， 带 有 不 害 
实 参 个 数 及 类 型 的 函数 的 形 参 列表 中 ， 至 少 会 有 一 个 形 参 ( 即 最 开始 


的 命名 形 参 ) ， 所 以 在 ... 之 前 的 那个 形 参 在 实 参 访问 机 制 中 将 扮演 一 
个 特殊 的 角色 。 


<stdarg.h> 标 准 头 文件 中 定义 的 va_list 类 型 是 一 个 完整 类 型 ， 用 来 
保存 va_start、va_arg、va_end 以 及 va_copy 这 4 个 宏 范 数 在 操作 过 程 中 
所 需要 的 状态 信息 ， 我 们 通常 会 在 获取 不 定 实 参 列表 之 前 先 用 va_list 
类 型 来 声明 一 个 对 象 。 我 们 也 能 将 va_list 声 明 的 实 参 传递 给 另 一 个 画 
数 ， 如 果 它 的 最 后 一 个 形 参 为 va_list 类 型 的 话 。 为 了 叙述 方便 ， 我 们 
假定 这 里 声明 了 一 个 va_list 对 象 ， 名 为 ap。 然 后 下 面 对 4 个 安 轴 数 的 介 
绍 中 都 用 ap 作为 va_list 声 明 的 对 象 。 


在 开始 访问 ... 所 对 应 的 实 参 之 前 ， 必 须 先 调用 va_start 宏 。va_start 
对 ap 进 行 初始 化 ， 这 样 ap 才 能 后 续 为 va_arg、va_end 等 宏 所 使 用 。 这 里 
大 家 需要 注意 的 是 ， 对 于 同一 个 不 定 参 数 类 型 与 个 数 的 参数 列表 而 
言 ，va_start 只 能 被 调用 一 次 。va_start 的 第 二 个 参数 需要 传 ，.… 之 前 的 


那个 形 参 对 象 ， 以 定位 不 定 参数 列表 从 哪个 命名 参数 开始 起 获取 。 


va_arg 安 扩展 为 一 个 表达 式 ， 用 于 指定 在 函数 调用 中 下 一 个 实 参 
的 类 型 与 值 。va_arg 安 的 第 一 个 参数 为 pp， 在 每 执行 一 次 va_arg 时 ，ap 
会 被 目 动 修改 为 下 一 个 实 参 的 值 ， 然 后 返回 。 因 此 ，va_arg 返 回 的 是 
当前 ap 所 指定 的 下 一 个 实 参 的 值 ， 同 时 ap 也 会 指定 到 下 一 个 实 参 位 
置 。 第 二 个 形 参 应 该 是 一 个 类 型 名 ， 该 类 型 名 与 调用 者 传 入 的 实 参 类 
型 对 应 。 这 里 各 位 要 注意 的 征 ， 由 于 调用 者 传 入 的 实 参 会 做 默认 的 实 


参 晋 升 ， 所 以 va_arg 的 第 二 个 参数 不 能 是 char、_Bool、short 等 低 于 int 
类 型 转换 等 级 的 整数 类 型 ， 如 果实 参 传 入 的 是 这 些 类 型 的 对 象 ， 那 么 
这 些 对 象 会 被 自动 晋升 为 int 类 型 。 因 此 要 获取 char、short 等 类 型 实 

时 ， 都 要 用 va_arg (ap，int) 。 如 果实 参 传 入 的 是 float 类 型 对 象 ， 那 么 
会 被 目 动 晋升 为 double 类 型 。 


当 获 取 完 不 定 参 数列 表 后 ， 调 用 va_end 宏 来 无 效 化 ap ， 这 样 ap 之 
后 职 不 可 再 使 用 了 。 


ee SB eda 
风 ， 两 者 都 是 va_list 类 型 的 对 象 。 如 采 src 对 和 象 已 经 通过 va_start 进 行 了 
初始 化 ， 并 且 通 过 几 次 va_arg 的 从 代 ， 那 么 这 束 好 比 完 对 dest 调 用 了 
va_start 安 ， 然 后 迭代 地 调用 va_arg 安 ， 直 到 dest 的 状态 与 src 的 状态 相 
同 。 


代码 清单 9-10 将 给 出 定义 与 调用 不 市 参数 个 数 的 函数 的 方法 以 及 
使 用 这 些 宏 的 详细 方法 。 


代码 清单 9-10 不 市 参数 个 数 及 类 型 的 范 数 的 定义 与 调用 


#include <stdio.h> 
#include <stdarg.h> 


// 定义 一 个 含有 一 个 ijnt 形 参 i 个 不 定 参 数 类 型 及 个 数 的 形 参 列表 
static void Mytest1(int ny .) 


// 首先 声明 va_1ist 类 型 的 对 象 ap 
va_list ap; 


// 对 ap 初 始 化 ， 并 指明 形 参 n 是 紧 跟 在 ..， 之 前 的 形 
va_start(ap, n); 


RN 


// 开始 获取 第 一 个 实 参 ， 其 类 型 为 int 
int a = va_arg(ap, int); 


// 和 迭代 获取 第 二 个 实 参 ， 其 类 型 为 unsigned 
unsigned b = va_arg(ap, unsigned); 


// 和 迭代 获取 第 三 个 形 参 ， 其 类 型 为 double 
double d = va_arg(ap, double); 


// 结束 迭代 ， 对 ap 无 效 化 处 理 


va_end(ap); 


printf("result = %f\n", n + a+ b+ d); 
} 


// 这 里 定义 函数 MyFunc， 其 第 二 个 形 参 为 va_1ist 类 型 
static double MyFunc(int n, va_list ap) 


， // 在 此 函数 中 ， 无 需 对 ap 做 va_start 初 始 化 以 及 va_end 的 无 效 化 
int a = va_arg(ap, int); 
unsigned b = va_arg(ap, unsigned); 
double d = va _arg(ap, double); 
returnn+a+b+d; 

} 

static void MyTest2(int Nn, ...) 

: va_list ap; 
va_start(ap, n); 
// 这 里 将 初始 化 完 的 ap 对 象 作 为 实 参 ， 传 递 给 MyFunc 
double result = MyFunc(n, ap); 
va_end(ap); 

printf("result = %f\n", result); 


Struct MyStruct { int a, b; }; 
union MyUnion { char c; Short s; }; 


// 我 们 也 可 以 用 自 定义 类 型 作为 不 定 参数 类 型 与 个 数 的 参数 列表 的 实 参 
static void MyTest3(int a, ...) 


va_list ap; 


va_start(ap, a); 


// 这 里 指定 了 MyStruct 结 构 体 类 型 
struct MyStruct s = va _arg(ap, struct MyStruct); 


// 尽管 un 的 大 小 为 2 个 字 节 ， 但 一 般 C 语 言 实现 都 会 对 它 做 默认 的 晋升 ， 
// 因此 这 里 指定 union MyUnion 也 没有 关系 

union MyUnion un = va_arg(ap, union MyUnion); 
printf("size of un: %zu\n", sizeof(un)); 


va_end(ap); 


int result = a 
// 输出 : result 
printf("result 


SsS.a+ S.b - un.s; 
10 
%d\n", result); 


村 :地 半 


} 
int main(int argc, const char * argv[]) 


int8_t a = 10; 
uint16 t b = 20; 


// 实 参 a 的 类 型 将 被 晋升 为 int 

// 实 参 b 的 类 型 将 被 晋升 为 unsigned 
// 实 参 10 .5f 的 类 型 将 被 晋升 为 double 
Mytest1(3, a, b, 10.5f); 


MyTest2(5, a, b, 10.5f),; 


// 这 里 将 一 个 结构 体 对 象 与 一 个 联合 体 对 象 作为 不 定 参 数 的 实 参 传递 
MyTest3(10， (Struct MyStruct) { 1, 2 }, (union MyUnion) { .s = 3 }); 


代码 清单 9-10 中 ，MyTest1 画 数 完整 地 通过 一 般 的 方式 来 获取 不 害 
参数 列表 部 分 的 实 参 ， 而 MyTest2 芳 re ei 不定 
参数 个 数列 表 部 分 的 实 参 。 像 我 们 ne 
的 带 有 不 定 参 数 个 数 与 类 型 的 库 函 数 。 该 函数 在 实现 中 通过 第 一 个 实 
参 的 字符 种 格式 符 来 解析 后 续 每 个 实 参 的 类 型 ， 从 而 可 以 恰当 地 获取 
实 参 的 值 。 


9.5 有 效 的 递归 调用 


C 语 言 的 函数 调用 有 一 个 十 分 有 趣 的 特性 ， 就 是 可 递归 调用 。 什 么 
是 递归 调用 ? 其 实在 我 们 中 学 数学 课 上 就 有 所 接触 了 。 比 如 ， 画 数 f 
(x) =x*f (x-1) ， 我 们 称 f (x) 为 一 个 递 推 方程 。 如 果 把 它 映射 到 C 
语言 中 ， 那 么 函数 f (x) 就 是 递归 调用 的 ， 也 就 是 在 计算 这 个 函数 的 时 
候 借用 了 该 函数 本 身 。 


在 一 个 函数 中 的 某 个 位 置 调用 该 男 数 目 己 ， 这 也 被 称 为 直接 递归 
调用 。 如 果 函 数 A 在 菏 个 位 置 调用 了 函数 B， 而 芳 数 B 在 某 个 位 置 处 又 
调用 了 函数 A， 那 么 这 僻 称 为 间接 递归 调用 。 


下 面 我 们 用 代码 清单 9-11 来 举 一 个 简单 的 例子 来 看 看 ， 函 数 递归 调 
用 是 如 何 执行 的 。 


代码 清单 9-11 ” 男 数 迎 归 调用 人 简介 


#include <stdio.h> 


static void Func(int n) 


// 如 果 n 等 于 0， 则 直接 返回 


if(n == 0) 
puts("last level!"); 
return; 
} 
// 打印 当前 形 参 n 的 值 ， 以 确定 现在 是 第 几 层 递归 调用 
printf("n = %d\n", n); 
// 递归 调用 Func ， 将 n - 1 作为 实 参 传 入 


Func(n - 1); 


puts("call over"); 


int main(int argc, const char * argv[]) 


Func(3); 


代码 清单 9-11 中 定义 了 一 个 Func 函 数 ， 在 其 内 部 实现 中 它 做 了 递归 
调用 。 在 每 次 递归 调用 时 ， 都 会 先 重新 进入 Func 函 数 ， 直 到 最 内 部 的 
调用 返回 ， 然 后 从 里 到 外 逐个 进行 调用 返回 。 在 main 函 数 中 用 实 参 3 来 
调用 Func 函 数 ， 因 此 最 后 输出 结果 是 : 
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下 面 我 们 用 图 9-4 来 描述 调用 Func 函 数 之 后 的 整个 控制 流 的 执行 。 
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图 9-4 ” 画 数 递归 调用 的 执行 流程 


图 9-4 中 ， 移 形 方 框 中 的 内 容 表 示 当 前 函数 中 要 执行 打印 的 内 容 。 
我 们 通过 这 个 顺序 图 可 以 清晰 地 看 到 ， 当 函数 Func 做 递归 调用 时 ， 它 
瑟 把 执行 控制 权 直 接 交 给 了 新 的 被 调 的 Func， 只 有 等 最 后 被 调 的 Func 
返回 之 后 ， 之 前 被 递归 调用 的 Func 才 能 再 获得 执行 权 继续 执行 。 我 们 
看 到 调用 与 返回 非常 具有 层次 感 。 


下 面 ， 我 们 将 列举 硅 干 实例 来 进一步 说 明 弟 归 函 数 的 使 用 方式 ， 
以 及 使 用 递归 函数 的 优 缺 点 。 


我 们 移 以 比较 简单 的 阶乘 算法 来 介绍 一 个 递归 函数 实现 的 具体 算 
法 方式 。 我 们 在 中 学 时 应 该 学 过 阶乘 的 表达 方式 ， 即 f (n) =n* (n-1) 
* (n-2) *...*1。 而 如 果 当 n 为 0 时 ， 则 f (0) =1。 所 以 这 可 以 用 简单 的 
递 推 式 来 表达 一 一 当 n==0 时 ，f (0) =1; 否则 , f (n) =n* (n-1) 。 而 

这 种 递 推 形式 的 函数 表达 式 束 能 方便 地 用 C 语 言 代码 来 表达 了 。 代 码 清 
单 9-12 展 示 了 阶乘 算法 的 递归 实现 与 循环 迭代 实现 两 种 方式 。 


代码 清单 9-12 ”阶乘 的 递归 实现 与 循环 迭代 实 


#include <stdio.h> 
int FactorialRecursion(int n) 


if(n < 1) 
return 1; 


// 这 句 表 达 式 语句 正如 我 们 所 提 到 的 类 似 : f(n) = n * f(n - 1) 这 种 形式 


return n * FactorialRecursion(n - 1) 


} 
int FactorialIteration(int n) 
{ 

if(n < 1) 


return 1; 


for(int i = n - 1; i > 0; i--) 
| = 


return n; 


pe 


int main(int argc, const char * argv[]) 
int result = FactorialRecursion(5); 
printf("result = %d\n", result); 
result = FactorialIlteration(5); 


printf("result = %d\n", result); 


代码 清单 9-12 中 ， 第 1 个 函数 FactorialRecursion 用 的 是 以 递归 调用 
的 方法 实现 的 阶乘 计算 ， 第 2 个 函数 FactorialIteration 则 是 用 循环 迭代 的 
方法 实现 的 阶乘 计算 。 从 表达 上 来 看 ， 我 们 可 以 很 明显 地 看 到 ， 和 采用 
递归 的 方式 比 采 用 循环 的 方式 要 简洁 很 多 。 从 执行 效率 上 看 ， 由 于 每 
次 做 递归 调用 都 需要 做 当前 函数 的 上 下 文保 护 ， 所 以 难免 会 做 一 些 堆 
栈 操作 ;此 外 还 有 画 数 调用 本 身 会 对 处 理 器 的 执行 流水 线 造成 一 定 影 
响 ， 因 此 运行 性 能 肯定 比 直 接 循 环 适 代 来 得 低 些 。 


通过 上 面 的 代码 清单 9-12， 我 们 能 看 到 ， 在 表达 上 递归 调用 形式 比 
循环 欠 代 更 为 简 污 ， 而 在 运行 效率 上 则 是 循环 友 代 更 有 优势 。 在 这 种 
单一 线性 数据 处 理 上 我 们 很 容易 使 用 循环 友 代 来 代 蔡 递归 调用 ; 然 
而 ， 如 果 是 树 状 数据 处 理 顺 序 ， 那 么 用 循环 就 很 难 去 表达 了 “。 这 个 时 
候 我 们 更 倾 加 于 直接 使 用 递归 调用 来 处 理 数据 。 代 码 清单 9-13 将 为 大 家 
呈现 更 为 复 洒 的 递归 函数 调用 方式 。 


代码 清单 9-13 更 复杂 些 的 函数 递归 调用 


#include <stdio.h> 
void ListNumber(int n) 
if(n > 9) 


printf("1i0\n"); 
return; 


} 

if(n < -9) 
printf("-10\n"); 
return; 

} 

printf("%d ", n); 


ListNumber(n * 2); 


ListNumber(-n * 2); 


int main(int argc, const char * argv[]) 


ListNumber (2); 


代码 清单 9-13 的 计算 输出 结果 为 : 


这 种 结 采 输出 显然 难以 用 单纯 的 循环 迭代 来 表达 ， 因 为 它 生 一 种 
树 状 输出 。 我 们 通过 图 9-5 来 列 出 结果 输出 过 程 。 
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图 9-5 ” 树 状 递归 执行 顺序 图 


图 9-5 中 ， 和 矩形 方 框 中 的 f 就 表示 代码 清单 9-13 中 的 ListrNumber 函 
数 。 直 线 上 的 用 圆 括号 包围 的 数字 表示 当前 调用 次 序 ， 比 如 (1) 表示 


第 1 次 重新 进入 ListNumber 函 数 ， (5) 表示 在 第 5 次 重新 进入 
ListNumber 函 数 。 显 然 ， 如 果 要 用 循环 迭代 来 表示 这 种 树 状 执行 次 序 将 
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会 十 分 复杂 。 所 以 ， 这 里 用 递归 形式 表达 不 仅 简洁 ， 而 且 更 有 效率 。 


最 后 ， 我 们 再 举 一 个 斐 波 那 掉 数列 的 例子 来 讲 一 下 函数 递归 调 
用 。 斐 波 那 契 数列 指 的 是 这 么 一 个 数列 : 0，1，1，2，3，5，8，13， 
21...…. 其 中 0 属于 第 0 项 ，1 属 于 第 1 项 。 从 第 2 项 开始 ， 当 前 项 的 数 是 其 
之 前 两 项 数 的 和 ， 所 以 可 以 用 这 个 数学 方程 来 表达 : Fn=F (n-1) +F 
(n-2) ，n>1 且 n 属 于 自然 数 。 代 码 清单 9-14 展 示 了 分 别 使 用 循环 迭代 
法 以 及 范 数 递归 调用 的 方法 来 求 得 第 n 项 的 斐 波 那 契 数列 的 值 。 


代码 清单 9-14 ”获取 斐 波 那 契 数列 的 指定 项 的 值 


#include <stdio.h> 


/** 用 循环 和 迭代 实现 获取 斐 波 那 契 数列 第 nTItem 项 的 值 */ 
static int FibonacciIteration(unsigned nItem) 


// 这 里 声明 的 former 表 示 一 开始 作为 第 0 项 的 值 ，current 则 表示 第 1 项 的 值 
int former = 0, current = 1; 


if (nItem == 0) 
return former; 

else if (nItem == 1) 
return current,; 


for (int n = 2; n <= nItem; n++) 


// 计算 当前 项 的 值 

int newValue = former + current,; 
// 将 前 一 项 的 值 赋值 给 前 第 二 项 

former = current ， 

current = newValue; 


} 


return current; 


} 


/** 用 函数 递归 调用 实现 获取 斐 波 那 契 数列 第 nItem 项 的 值 */ 
static int FibonacciRecursion(unsigned nItem) 


if (nItem == 0) 
return 0; 


else if (nItem < 2) 
return 1; 


// 递归 调用 FibonacciRecursion， 求 得 当前 第 nItem 项 的 值 
return FibonacciRecursion(nItem - 1) + FibonacciRecursion(nItem - 2); 


int main(int argc, const char * argv[]) 


int value = FibonacciIteration(8); 
printf("value = %d\n", value); 

// 第 8 项 的 值 为 21 

value = FibonacciRecursion(8); 
printf("value = %d\n", value); 


图 9-6 展 示 了 递归 调用 代码 请 单 9-14 中 的 FibonacciRecursion (5) 的 
调用 流程 。 
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(5) 中 
图 9-6” 辈 波 那 提 数 列 的 函数 递归 调用 流程 图 
图 9-6 中 ， 和 矩形 框 表示 当前 调用 的 FibonacciRecursion 芳 数 ， 其 上 方 


的 数字 表示 当前 调用 是 第 几 次 调用 ， 比 如 〈1) 表示 第 一 次 调用 ， 
(2) 表示 第 二 次 调用 。 从 这 个 图 中 我 们 也 能 容易 发 现 ， 某 一 次 函数 调 


用 的 结果 就 是 它 下 面 两 次 调用 结果 的 和 。 所 以 FibonacciRecursion (5) 


函数 调用 的 最 终结 果 束 是 5。 


9.6 ”内 联 函 数 


从 C99 标 准 开始 起 ，inline 关 键 字 被 正式 纳入 C 语 言 标 准 。 在 C11 标 
准 中 ，inline 与 下 一 小 节 将 摘 述 的 _Noreturn 都 属于 函数 说 明 符 
(function specifier) 。C11 标 准 中 明确 指出 ， 画 数 说 明 符 应 该 仅 用 在 
对 一 个 函数 标识 符 的 声明 中 。 


如 果 一 个 函数 用 inline 画 数 说 明和 从 进行 声明 ， 那 么 该 画 数 古 一 个 内 
联 函 数 。 内 联 函 数 是 对 C 语 言 编译 器 的 暗示， 建议 编译 右 对 该 贸 数 的 
调用 尽 可 能 地 快 。 


具有 内 部 连接 的 任 一 函数 都 可 以 作为 一 个 内 联 画 数 。 而 对 于 具有 
外 部 连接 的 函数 则 具有 以 下 限制 : 如 采 一 个 函数 用 inline 函 数 说 明 符 进 
行 声 明 ， 那 么 它 也 应 该 定义 在 同一 翻译 单元 中 。 如 果 对 一 个 函数 在 所 
有 文件 作用 域 的 声明 ， 在 某 一 翻译 单元 中 包含 了 inline 范 数 说 明 符 ， 而 
没有 extern， 那 么 在 该 翻译 单元 中 的 定义 是 一 个 内 联 定义 。 内 联 定义 不 
提供 对 该 函数 的 外 部 定义 ， 并 且 也 不 葵 用 它 在 兄 一 个 翻译 单元 中 的 外 
部 定义 。 内 联 定 义 提 供 了 对 一 个 外 部 定义 的 区 代 品 ， 编 译 右 可 以 用 来 
实现 在 同一 翻译 单元 中 对 该 函数 的 任 一 调用 (选择 内 联 定义 的 调用 或 
外 部 定义 的 调用 ) 。 对 函数 的 调用 使 用 的 是 内 联 定义 还 是 外 部 定义 则 
征 未 指定 的 。 


具有 外 部 连接 的 一 个 函数 的 内 联 定 义 ， 不 应 该 包 侣 具有 静态 或 线 
程 存储 周期 的 一 个 可 修改 对 象 ， 并 且 也 不 应 该 包含 对 一 个 具有 内 部 连 
接 标 识 符 的 引用 。 


代码 清单 9-15 展 示 了 内 联 画 数 的 使 用 以 及 一 些 注意 事项 。 
代码 清单 9-15 ”内 联 画 数 的 定义 与 使 用 


// main.c 源 文件 
#include <stdio.h> 


// Func 是 一 个 具有 内 联 定义 的 函数 
inline int Func(int n) 


return n * 2,; 


extern inline int Func2(int n) 


// 对 于 具有 外 部 连接 的 人 不 应 该 包含 可 修改 的 静态 存储 周期 对 象 。 
// 这 里 编译 器 可 能 会 报 出 警告 
static int s,; 


Ss += Nn; 


return s + n; 


} 


static inline int Func3(int n) 


// 对 于 具有 内 部 连接 的 一 个 内 联 画 数 ， 可 以 包含 可 修改 的 静态 存储 对 象 


static int s; 


s += n; 


return s + n; 


} 


// MyTest 函 数 定义 在 hello.c 源 文件 
extern void MyTest(void); 


十 
UD 


int main(int argc, const char * argv[]) 


int result = Func(3); 
printf("result = %d\n", result); 


MyTest(); 


// 调 完 MyTest( ) 画 函数 之 后 ，Func2 画 数 中 静态 对 象 s 的 值 变 为 了 20 
result = Func2(10); 
printf("result in main is: %d\n", result); 


// 在 调用 Func3 画 数 之 前 ， 它 所 包含 的 静态 对 象 s 的 值 为 0 


result = Func3(1) 
printf("result 1 = %d\n", result); 


// 在 调用 了 一 次 Func3 函 数 之 后 ， 它 所 包含 的 静态 对 象 s 的 值 为 1 
result = Func3(2) 
printf("result 2 = %d\n", result); 


} 
// hello.c 源 文件 
#include <stdio.h> 


// 这 里 将 Func 定 义 为 具有 外 部 连接 的 一 个 函数 
int Func(int ny) 


return n * 3,; 


inline int Func2(int n) 
static int s; 
S += nN; 


return s + n; 


void MyTest(void) 
printf("value is: %d\n", Func(2)); 


int result = Func2(20); 
printf("result in MyTest is: %d\n", result); 


} 


代码 清单 9-15 分 为 两 个 源 代码 ， 第 一 个 是 main.c， 第 二 个 是 
hello.c。 这 两 个 源 文 件 放 在 同一 工程 内 ， 然 后 编译 后 连接 生成 可 执行 
文件 。 在 main.c 中 ， 定 义 了 一 个 具有 内 联 定义 的 Func 函 数 ( 它 没有 用 
exter 修 饥 ， 仅 具有 inline 函 数 说 明 符 ) ， 而 在 hello.c 中 则 定义 了 相同 画 
数 名 Func 的 外 部 定义 ， 在 连接 时 不 会 引发 符号 重 定义 的 冲突 。 但 是 ， 
在 main.c 的 Func 定 义 中 ， 倘 车 在 inline 前 面 添加 extem， 则 会 引发 Func 符 
号 重 定 义 的 连接 错误 。 因 为 此 时 它 真 具有 了 外 部 连接 ， 而 不 是 一 个 仅 
具有 内 联 定义 的 函数 。 


在 main 函 数 中 ， 第 一 条 调用 Func 函 数 的 语句 ， 它 可 以 被 编译 器 直 
接 翻 译 为 : int result=3*2; 。 内 联 男 数 的 作用 惑 是 建议 编译 右 以 最 快 
的 方式 调用 函数 。 那 么 将 函数 中 的 语句 内 容 直 接 扩展 出 来 ， 使 得 与 当 
前 函数 调用 者 的 上 下 文 结合 进行 优化 ， 无 疑 是 最 快 的 方式 。 当 然 ， 
inline 仅 仅 起 到 建议 的 作用 ， 内 联 函 数 的 调用 是 做 代码 展开 还 是 直接 做 
普通 的 函数 调用 完全 由 编译 亏 做 最 后 的 决定 。 


函数 Func2 与 Func3 则 呈现 了 上 文 所 摘 述 的 对 内 联 函 数 中 包含 静态 
存储 周期 对 象 的 限制 。Func2 之 所 以 不 能 在 函数 体内 包含 静态 对 象 ， 是 
因为 内 联 定义 的 函数 其 本 质 上 仍然 是 外 部 的 ， 也 整 古 说 尽管 它 可 以 出 
现在 不 同 的 翻译 单元 ， 但 它 仍然 只 具有 一 个 实体 。 也 束 古 说 ， 其 内 部 
定义 的 静态 对 象 对 于 整个 执行 程序 而 言 也 是 唯一 的 ， 所 以 它 在 不 同 源 
文件 中 的 调用 ， 其 内 部 静态 对 象 s 的 值 会 受到 影响 ( 即 具有 不 可 见 的 副 
作用 ) 。 而 具有 static 存 储 类 的 内 联 函 数 本 身 就 具有 内 部 连接 ， 因 此 每 
个 翻译 单元 具有 一 个 独立 的 对 象 副本 ， 所 以 在 多 个 源 文 件 中 进行 调用 
时 相互 之 间 不 会 有 任何 有 影响。 对 函数 中 包含 静态 存储 周期 对 象 的 情况 


的 详细 介绍 ， 请 参考 11.3 节 。 


9.7” 王 数 的 返回 闫 型 与 无 返回 转 效 


前 面 几 六 讲 解 了 函数 的 形 参与 实 参 的 传递 以 及 函数 的 调用 等 ， 本 
节 将 详细 描述 函数 的 返回 。 


在 C 语 言 中 ， 画 数 的 返回 类 型 几乎 可 以 是 任意 类 型 ， 包 括 整 型 、 
浮 点 型 等 基本 类 型 ， 枚 举 、 结 构 体 、 联 合体 等 用 户 自 定义 类 型 ， 也 可 
以 是 指向 上 述 这 些 类 型 的 指针 ， 但 唯 独 不 允许 数组 类 型 。 除 了 返回 类 
型 为 void 的 情况 外 ， 一 个 函数 中 的 任 一 分 支 代码 最 终 必 须要 触 碰 一 条 
retum 语 句 进行 函数 返回 。 对 于 返回 类 型 为 void 的 函数 ， 在 其 函数 体 结 
尾 处 会 默认 隐 含 一 条 return 语 句 。 当 函数 体 中 出 现 return 语 句 时 ，return 
后 面 跟着 的 表达 式 的 类 型 必须 要 与 函数 返回 类 型 兼容 ， 如 果 retum 后 面 
是 一 条 空 表达 式 〈 比 如 直接 以 分 号 结尾 ) ， 那 么 表示 返回 的 是 一 个 
void 表达 式 。 


代码 清单 9-16 展 示 了 函数 返 回 的 一 些 前 用 技巧 。 


代码 清单 9-16 C 语 言 贸 数 返 回 的 党 用 技巧 


#include <stdio.h> 


// 这 里 定义 了 一 个 返回 类 型 为 nt 的 函数 
static int MyIntFunc(int a) 


// 确保 函数 最 终 执行 完 时 都 要 触 碰 一 条 return 语 句 。 

// 这 里 的 if、if-else、 以 及 else 语 句 后 面 的 return 语 句 都 不 能 省 ， 
// 如 果 else 后 面 的 return 0 省 了 之 后 ， 

// 在 a 等 于 9 的 情况 下 函数 的 返回 值 是 不 确定 的 
if(a > 0) 


return 100 
else if(a < 0) 

return -100; 
else 

return ©; 


} 


// 这 里 定义 了 一 个 返回 类 型 为 int* 的 函数 
static int* MyIntPtrFunc(void) 


static int s = 100; 


return &s; 


} 


// 这 里 定义 了 一 个 返回 类 型 为 一 个 结构 体 的 函数 
static struct SA { int a; float f; } MyStructFunc(void) 


return (struct SA){ 100, -10.25f }; 
} 
| 


// 这 里 定义 了 一 个 返回 类 型 为 一 个 枚 举 的 函数 
static enum { MY_ENUM1, MY_ENUM2 } MyEnumFunc(void) 


return MY_ENUM2; 
} 


static void MyVoidFunc(int a) 
if(a > 0) 
{ 


puts("a is above zero!"); 


// 这 里 使 用 (void ) 投 射 操作 将 表达 式 转 为 void 表达 式 。 
// 这 里 要 注意 的 是 ，printf 的 返回 类 型 为 int， 而 不 是 void 
return (a > 10)? (void)printf("a = %d\n", a) : (void)0， 


int main(int argc, const char* argv[]) 


int a = MyIntFunc(1); 
printf("a = %d\n", a); 


int *p = MyIntPtrFunc(); 
printf("*p = %d\n", *p); 


struct SA Sa = MyStructFunc(); 
printf("sum of sa is: %.2f\n", sa.a + sa.f); 


a = MyEnumFunc(); 
printf("enum is: %d\n", a); 


MyVoidFunc(100); 


C11 标 准 引 入 了 _Noreturn 关 键 子 ， 它 也 是 函 数 说 明 答 。 如 果 一 个 
玉 数 用 一 个 _Noretum 函 数 说 明 符 来 声明 ， 那 么 该 函数 不 应 该 返回 给 其 


调用 者 。 所 以 用 _Noretum 修 饥 的 男 数 ， 其 返回 类 型 应 该 是 void 类 型 。 
此 外 ，C11 标 准 也 引入 了 <stdnoretum.h> 头 文件 ， 其 中 将 _Noreturn 定 义 
为 了 noreturn， 因 此 我 们 应 该 尽量 包 售 <stdnoreturn.h> 头 文件 ， 然 后 直 
接 使 用 noreturn 。 


在 应 用 端 开发 中 ，_Noreturn 很 少 使 用 。 该 画 数 一 般 用 于 骨 入 式 系 
统 中 某 些 异常 处 理 例 程 ， 或 是 用 于 线程 处 理 例 程 ， 倘 铬 这些 例 程 
(routine) 不 做 任何 返回 的 话 。 在 C11 标 准 库 中 ， 像 longjmp、abort、 
exit、quick_exit 等 库 函 数 均 以 _ Noreturn 进 行 声 明 。 代 码 清单 9-17 将 说 
明 _Noretum 的 一 些 使 用 方式 与 规则 。 


代码 清单 9-17 ” _Noreturn 的 使 用 


#include <stdio.h> 

#include <stdlib.h> 

#include <stdnoreturn.h> 

// 用 noreturn 声 明了 函数 Routine。 

// 在 Routine 函 数 内 不 能 出 现任 何 return 语 句 
noreturn void Routine(int n) 


if(n > 0) 


printf("n = %d\n", n); 


// 这 里 将 中 止 程序 执行 ， 应 用 程序 执行 到 abort( ) 时 将 会 引发 异常 
abort(); 


else 


// 这 里 退出 整个 程序 的 执行 
puts("Exit!"); 
exit(n); 


} 


} 
int main(int argc, const char * argv[]) 


Routine( -10); 


代码 清单 9-17 中 所 调用 的 abort () 以 及 exit 〈) 库 函 数 的 原型 都 声 
明 在 <stdlib.h> 头 文件 中 。 


9.8 指 回 函数 的 指针 


C 语 言 中 的 指针 是 一 个 非常 灵活 、 强 大 、 适 用 范围 广 的 属性 ， 一 
个 指针 可 指 回 几 乎 所 有 对 象 类 型 ， 它 也 能 指 癌 任何 函数 。 其 实在 C 语 
言 中 ， 一 个 函数 标志 用 于 表达 式 时 整 已 经 表征 了 一 个 指 疝 该 函数 类 型 
的 指针 。 


比如 我 们 声明 了 一 个 函数 Func- “void Func (void) ; ”那么 对 
于 函数 调用 表达 式 一 一 Func () 而 言 ， 其 实 这 里 的 Func 后 绥 表 达 式 就 
已 经 表示 了 一 个 指向 返回 类 型 为 void， 且 参数 列表 为 空 的 函数 的 指 
针 ， 该 类 型 表示 为 : 


void (*)(void) 


函数 指针 类 型 的 通用 表达 形式 为 : 


高 


可 类 型 (* cv 限定 符 可 选 ) ( 形 参 列表 ) 


指针 对 象 的 标识 符 放 在 可 缺 省 的 cv 限定 符 之 后 、“) ”之 前 。cv 限 
定 符 即 为 const、volatile 限 定 符 ， 这 些 将 在 第 12 章 中 详细 介绍 。 另 外 ， 
对 于 有 些 C 语 言 实现 含有 画 数 调 用 约定 的 ， 那 么 在 函数 指针 类 型 中 将 
函数 调用 约定 说 明 符 放 在 * 前 面 ， 比 如 void (stdcall (*) (void) 
函数 调用 约定 详 见 第 15 章 。 


声明 一 个 指向 函数 的 指针 对 象 时 ， 其 形 参 列表 与 返回 类 型 的 要 求 
与 一 般 函 数 声明 的 要 求 一 样 ， 返 回 类 型 以 及 形 参 类 型 可 以 是 不 完整 类 
型 。 通 过 函数 指针 对 象 可 以 立即 对 它 所 指向 的 函数 进行 调用 (这 在 处 
理 器 中 对 应 的 是 寄存 器 间接 调用 指令 ) 。 一 个 函数 标志 本 身 即 可 表示 
为 一 个 指向 该 函数 类 型 的 指针 ， 而 如 果 在 它 前 面 加 地 址 操作 符 &， 同 
样 也 表示 指向 该 函数 的 指针 ， 两 者 在 类 型 上 是 完全 等 同 的 。 也 就 是 
说 ， 如 果 有 : void Func (void) ， 那 么 Func 与 &Func 的 类 型 都 为 void 
(*) (void) 类 型 。 


此 外 ， 正 如 我 们 很 早 之 前 所 说 的 ， 任 一 对 象 都 有 其 地 址 ， 那 么 指 
向 函数 的 指针 对 象 也 不 例外 ， 如 果 对 指向 函数 的 指针 对 象 取 了 其 地 
址 ， 那 么 其 类 型 表示 为 在 〈) 中 的 “*” 之 前 、“ (* 之 后 再 加 一 个 “*”。 
比如 ， 如 采 存 在 一 个 指 回 函 数 的 指针 对 象 
(void) ， 那 么 &pFunc 的 类 型 即 为 void (**) (void) 。 这 里 要 注意 
的 是 ，pFunc 与 上 面 描述 的 Func 是 不 同 的 ， 因 为 Func 本 号 是 一 个 函数 标 

， 所 以 &Func 仍 然 可 表示 为 指向 一 个 函数 的 指针 ， 以 至 于 它 与 Func 
在 类 型 上 是 等 同 的 ， 而 pFunc 本 质 上 就 是 一 个 指 回 函 数 的 指针 对 象 标识 
符 ， 所 以 &pFunc 束 是 指 回 函 数 指针 对 象 的 指针 。 


void (*pFunc) 


代码 清单 9-18 展 示 了 指向 函数 指针 的 用 法 。 


代码 清单 9-18 ”指向 范 数 的 指针 示例 


#include <stdio.h> 
#include <stdarg.h> 


// 这 里 仅 声 明了 MyStruct 结 构 体 类 型 
struct MyStruct; 


里 声明 ] 态 : 风 指 辐 函数 的 指针 p， 
指 癌 的 函数 二 可 类 型 是 一 个 不 完整 类 型 MyStruct 类 型 ， 
区 入 3 同伴 也 部 是 不 守 部 关节 

有 形 参 中 可 加 标识 符 ， 当 然 形 参 标识 符 也 可 缺 省 ， 这 与 声明 函数 原型 时 一 样 
truct MyStruct (*p)(struct MyStruct s, int a[*]) = NULL,; 


// 这 里 声明 函数 Test， 在 main 函 数 下 面 定 义 
static void Test(void),; 


// 这 里 定义 ] Foo 画 数 ， 它 含有 一 个 不 定 参数 个 数 与 类 型 的 参数 列表 
// 其 实现 为 对 不 定 参 数 进行 求 和 运 和 ， 然 后 将 结果 返 世 
static int Foo(int n, .) 
{ 

va_list ap; 

va_start(ap, n); 

int Sum = 0; 

for(int i = 0; i < n; i++) 

Sum += va_arg(ap, int); 

va_end(ap); 

return sum; 
} 


int main(int argc, const char * argv[]) 


// 这 里 声明 了 指向 函数 Test 的 指针 对 象 pf 
void(*pf)(void) = Test,; 


// 通过 函数 指针 pf 间接 调用 Test 画 数 ， 这 里 也 可 以 使 用 pf( ) 进 行 调用 。 
// 由 于 画 数 调用 操作 符 ( ) 的 优先 级 大 于 间接 操作 符 *， | 
// 所 以 这 里 需要 使 用 (*pf ) 将 它 作为 整体 ， 作 为 函数 标志 的 后 级 表达 式 


// 这 里 声明 了 指向 函数 的 指针 pFunc， 其 形 参 标识 符 缺 省 ， 
// Foo 画 数 地 址 对 它 进行 初始 化 。 这 里 的 & 可 缺 省 
int(*pFunc)(int, ...) = &Foo; 


// 这 里 3 指向 函数 的 指针 pFunc 进 行 间接 的 函数 调 
int result = pFunc(3, 10, 20, 30); 
printf("result = %d\n", result); 


// 这 里 声明 了 指向 函数 指针 对 象 的 指针 
int(**pp)(int, ...) = &pFunc; 


// 这 里 通过 指向 范 数 指针 的 指针 pp 做 Foo 函 数 的 间接 调 
result = (*pp)(5, 1, 2, 3, 4, 5); 
printf("result2 = %d\n", result),; 


// 将 pp 所 指 对 象 的 值 置 空 ， 使 得 pFunc 对 象 的 值 为 空 
*pp = NULL; 


下 人 


if(pFunc == NULL) 
puts("Null!"),; 


// 这 里 对 MyStruct 进 行 定义 
struct MyStruct 
{ 


int a; 
float f; 
}; 
static struct MyStruct Func(struct MyStruct s, int a[]) 
printf("sum = %f\n", s.a + Ss.f + a[90]); 
return s; 


// 对 Test 函 数 做 定义 
static void Test(void) 


// 在 文件 作用 域 声明 的 指向 画 数 的 指针 p 指 向 Func 画 数 


p = Func; 


// 通过 指向 画 数 的 指针 p 进 行 间接 函数 调 
p((struct MyStruct){.a = 10, .f = 0.5f}, (int[]){1i, 2, 3}); 


代码 清单 9-18 列 出 了 指向 函数 的 指针 的 各 种 使 用 方式 。 此 外 ， 指 
向 函数 的 指针 对 象 也 能 作为 一 个 函数 的 参数 ， 同 时 一 个 函数 的 返回 类 
型 也 可 以 为 指向 函数 的 指针 类 型 。 比 如 : void (*func (int (*p) 
(void) ) ) Mint) ; 就 声明 了 一 个 返回 类 型 为 void (*) (int) 、 带 
有 一 个 类 型 为 int (*) (void) 形 参 的 函数 func 。 


9.9 Ci 语言 中 的 主 函 数 main 


在 C 语 言 中 ， 将 应 用 启动 时 调用 的 函数 命名 为 main 函 数 。C 语 言 实 
现 不 需要 对 此 画 数 做 原型 声明 。 它 应 该 被 定义 为 返回 类 型 为 Int， 并 上 且 
不 带 任何 形 参 的 画 数 ， 如 : int main (void) {/*...*/}; 或 者 带 有 两 个 形 
参 的 函数 ， 如 : int main (int argc，char*argv[]) {/*...*/}。 这 两 个 形 参 
所 对 应 的 实 参 是 在 执行 该 程序 时 传 入 的 。argc 一 般 存 放 执 行当 前 程序 
时 输入 的 命令 字符 串 个 数 ，argv 则 存放 了 指向 各 个 输入 字符 串 的 指 
针 。 假 设 我 们 现在 对 C 源 文件 编译 构建 后 ， 生 成 了 一 个 名 为 test 的 可 执 
行文 件 。 那 么 我 们 在 控制 台中 输入 test argl arg2， 再 按 回 车 ， 那 么 此 
时 ，main 函 数 的 第 一 个 参数 argc 的 值 为 3， 因为 test 其 实 就 属于 要 传 入 
到 argv 数 组 的 第 1 个 参数 ， 然 后 后 面 跟着 2 个 命令 行 参数 arg1 和 arg2; 所 
以 argv 对 应 的 实 参 内 容 为 ，{ “test”"，“arg1”，“arg2”}， 即 由 应 用 程序 名 
与 其 命令 行 参数 字符 串 所 构成 的 数组 。 如 果 将 main 画 数 声 明 为 带 有 两 
个 形 参 的 形式 ， 那 么 它们 应 该 遵循 以 下 约束 ; 


1) argc 的 值 应 该 是 一 个 非 负数 。 
2) argv[argc] 应 该 是 一 个 空 指针 。 


3) 如 果 argc 的 值 大 于 零 ， 那 么 数组 成 员 argv[0] 到 argv[argc-1] 应 该 
包含 指向 字符 串 的 指针 ， 这 些 字符 串 在 程序 启动 前 由 主机 环境 给 出 。 


如 果 argc 的 值 大 于 1， 那 么 argv[1] 到 argv[argc-1] 所 指 辣 的 字符 串 才 表 示 
程序 形 参 ， 即 当前 应 用 名 后 面 的 命令 行 参数 。 


4) 形 参 argc 和 argv 以 及 argv 数 组 所 指向 的 字符 串 可 以 在 程序 中 修 
改 ， 并 且 在 程序 启动 和 终止 之 间 保留 其 最 后 被 修改 的 值 。 


main 函 数 的 返回 值 相 当 于 调用 库 函 数 exit 所 传 入 的 实 参 值 。 如 果 
main 函 数 中 缺 省 return 语 句 ， 那 么 默认 为 return 0。 


代码 清单 9-19 展 示 了 main 函 数 参 数 的 使 用 。 
代码 清单 9-19 _ main 函数 的 执行 


#include <stdio.h> 
int main(int argc, const char * argv[]) 


if(argc == 0) 
return -1; 


// argv[9] 指 向 的 字符 串 为 当前 程序 名 
printf("The program name is: %s\n", argv[0]); 


// 以 下 依次 输出 程序 名 后 面 的 参数 名 
for(int i = 1; i < argc; I++) 
printf("arg %d: %s\n", i, argv[i]); 


// 我 们 可 以 对 argc、argv 参 数 进 行 任意 修改 
argc = 10,; 


argv[90] = "hello"; 
argv[1] = “world",; 
argv = NULL; 


// 缺 省 return 语 句 ， 这 里 默认 为 return 0 


假定 我 们 将 代码 清单 9-19 编 译 构建 后 生成 了 test 可 执行 文件 。 然 后 
在 控制 台 下 ， 进 入 到 test 当 前 路 径 ， 再 输入 test argl arg2， 那 么 结果 将 


会 输出 : 


The program name is: test 
arg 1: arg1 
arg 2: arg2 


这 里 ， 程 序 默认 的 入 口 函 数 承 是 main 函 数 ， 因 此 main 函 数 必须 要 
有 外 部 连接 ， 它 不 能 是 static 的 。 此 外 ，main 函 数 也 不 能 这 有 inline、 


_Noreturm 等 函 函数 说 明 符 。 


9.10 ” 畏 数 与 国 数 调用 作为 sizeof 操 作 符 


C 语 言 标准 明确 规定 ，sizeof 操 作 符 不 应 该 应 用 于 : 具有 函数 类 
型 ，@ 一 个 不 完整 类 型 的 表达 式 ; @) 访 问 一 个 位 域 成 员 的 表达 式 。 
_Alignof 操 作 符 不 应 该 应 用 于 一 个 函数 类 型 或 不 完整 类 型 。 这 里 大 家 
要 注意 的 是 ， 当 一 个 函数 标志 作为 sizeof 或 _Alignof 的 操作 数 时 ， 它 不 
会 被 隐 式 转换 为 指 加 该 男 数 类 型 的 指针 类 型 ， 这 个 与 它 单独 用 于 其 他 
计算 表达 式 有 所 不 同 。 因 此 ， 假 定 我 们 定义 了 一 个 函数 : void Foo 
(void) ， 那 么 sizeof (Foo) 的 结果 是 未 定义 的 ;而 sizeof (&Foo) 是 
合法 的 ， 其 结果 相当 于 sizeof (void \*) (void) ) ， 也 就 是 一 个 指针 
对 象 关 小 * 


如 果 sizeof 的 操作 数 是 一 个 函数 调用 表达 式 ， 那 么 它 的 结果 相当 于 
sizeof (函数 返回 类 型 ) ， 同 时 ， 作 为 sizeof 操 作 数 的 函数 调用 将 不 会 
发 生 。 由 于 函数 返回 类 型 不 能 是 一 个 可 变 修 改 类 型 ， 因 此 这 里 不 会 涉 
及 在 运行 时 对 可 变 修改 类 型 对 象 所 占 存 储 空 间 大 小 的 计算 。 


代码 清单 9-20 展 示 了 sizeof 作 用 域 画 数 的 一 些 代码 。 
代码 清单 9-20 ”sizeof 与 代码 


#include <stdio.h> 


static int Funci(void) 


puts("Func1"); 
return ©; 


} 


static void Func2(void) 


puts("Func2"); 


int main(int argc, const char * argv[]) 


{ 


// 这 里 由 于 Funci 返 回 的 是 ijnt 类 型 ， 所 以 sizeof 的 结果 相当 于 sizeof (int) 


size_t size = sizeof (Func1( )); 
printf("Func1() size is: %zu\n", size); 


// 由 于 Func2 的 返回 类 型 是 void， 它 属于 不 完整 类 型 ， 


// 因此 理论 上 这 里 的 sizeof 结 果 在 标准 里 是 未 定义 的 ， 


// 在 GCC 与 Clang 的 实现 上 ， 结 果 为 1 
size = Sizeof(Func2())， 
printf("Func2() size is: %zu\n", size); 


// 这 里 将 Func1， 一 个 函数 标识 作为 sizeof 操 作 数 ， 
size = Sizeof(Func1) ， 
printf("Function size is: %zu\n", size); 


// 这 


// a ) (void) ) 相 同 
size = sizeof(&Func1); 


妆 


了 为 是 未 定义 的 


I 
个 


yj&fFunc1， 即 一 个 函数 指针 类 型 作为 sizeof 操 作 数 ， 


printf("Function pointer size is: %zu\n", size); 


9.11 本 章 小 结 


革 主 要 介绍 了 C 语 言 的 贸 数 ， 对 函数 返回 类 型 、 形 参 以 及 函数 
调用 与 实 参 传 递 等 知识 进行 了 全 方位 的 讲解 。 通 过 对 本 章 的 学 习 ， 各 
位 应 该 能 理解 并 目 己 会 写 函 数 ， 将 目 己 的 一 些 功 能 逻辑 给 模块 化 、 抽 
象 化 。 在 本 章 中 ， 比 较 难 以 理解 的 可 能 束 属 函数 递归 调用 了 ， 如 采 大 
家 是 专攻 于 一 些 数学 算法 的 ， 硕 望 能 再 好 好 消化 一 下 。 


第 10 和 章 ”C 语 言 预 处 理 需 


C 语 言 编译 右前 痢 还 分 为 预 处 理 阶 段 与 编译 阶段 。 预 处 理 阶 自古 
通过 C 语 言 的 各 类 预 处 理 器 将 指定 的 一 些 字 符 和 从 号 直接 巷 换 到 即将 编 
译 的 源 代码 。 预 处 理 右 在 跨 平 台 整 合 上 很 有 帮助 ， 我 们 一 般 可 以 利用 
预 处 理 絮 针对 有 差异 的 系统 平台 安插 不 同 的 源 代码 。 除 此 之 外 ， 当 前 
遵循 C11 标 准 的 预 处 理 器 的 功能 已 经 十 分 强劲 ， 我 们 可 以 利用 预 处 理 
妖 生 成 灵活 强大 的 代码 ， 可 以 把 某 些 代 码 逻 辑 通 过 宏 定 义 来 融 度 抽象 


化 有 


局 一 Ar 


用 于 预 处 理 的 指示 符 称 为 预 处 理 指 示 符 (preprocessing 
directives) ，C 语 言 主要 有 三 大 类 预 处 理 指示 符 一 一 条 件 段 (if- 
section) 预 处 理 指示 符 、 控 制 行 (control-line) 预 处 理 指示 符 、 空 指示 
符 (null directive) 。 本 章 将 会 为 大 家 介绍 条 件 预 处 理 、 文 件 包含 、 宏 
替换 、 行 控制 、 错 误 指 示 符 、 编 译 指 示 (pragma) 指示 符 、 空 指示 符 


以 及 C11 标 准 中 预定 义 的 宏 名 。 


AN 


对 于 任意 一 条 预 处 理 指示 符 ， 除 了 _Pragma 之 外 ， 其 他 的 都 必须 


是 以 # 符 号 打头 ， 并 且 # 伴 号 必须 出 现在 每 一 行 的 最 前 面 。 也 了 就 是 说 ， 
如 采 我 们 要 在 源 文 件 中 某 一 行使 用 一 条 预 处 理 指 示 符 ， 那 么 最 开头 驶 
得 写 上 #， 前 面 除了 空白 符 之 外 不 允许 出 现 其 他 任何 字符 。 一 条 预 处 理 


和 示 符 的 最 后 都 无 需 加 分 号 。 对 于 预 处 理 组 (比如 条 件 段 预 处 理 指示 
符 ) 而 言 ， 其 作用 范围 从 组 的 起 始 指 示 符 开始 的 下 一 行 一 直到 该 组 结 
束 指示 符 的 上 一 行 。 对 于 控制 行 预 处 理 器 指示 符 (比如 宏 定 义 ) 而 

言 ， 一 行 束 定义 了 某 个 符号 或 执行 某 个 动作 ， 它 们 不 作用 到 下 一 行 。 


Os C 语 言 的 预 处 理 妖 拥有 上 自己 独立 的 文法 ， 我 们 可 以 将 
它 看 作为 徐 入 在 C 源 代码 中 的 一 段 编 译 指 示 脚 本 ， 用 于 在 当前 源 文 件 
中 构建 指定 的 后 续 要 进行 编译 的 C 源 代码 。 所 以 大 家 不 要 将 它 与 之 前 
描述 的 C 语 言 的 一 些 语 法 特征 给 搞 混 ， 而 使 用 预 处 理 套 吏 好 比 在 使 用 


元 编程 (metaprogramming) 。 


104 溉 十 六 


宏 定 义 属于 控制 行 预 处 理 指 示 符 。 以 #define 定 义 的 一 个 符号 称 为 
宏 (macro) 。 这 里 ，# 与 define 之 间 可 以 存在 空白 符 (换行 符 除 外 ) ， 
但 对 于 某 些 C 代 码 编辑 器 而 言 ， 一 旦 # 与 define 之 间 存 在 空白 符 ， 可 能 

导致 编辑 需 在 词法 上 无 法 识别 ， 从 而 无 法 获得 该 有 的 语法 高 亮 。 因 
此 建议 各 位 在 用 以 桂 ] 头 的 任何 预 处 理 指 示 符 的 时 候 ，# 与 跟 在 它 后 面 
的 指示 符 之 间 不 要 有 任何 空 日 符 


在 C 语 言 中 ， 安 的 定义 有 两 种 形式 ， 一 种 是 类 似 对 和 象 的 安定 义 ， 
一 种 是 类 似 函 数 的 安定 义 。 类 似 对 象 的 安定 义 的 形式 为 : 


# define ”标识 符 替换 列表 换行 符 


类 似 函 数 的 宏 定 义 形 式 为 : 


# define 标识 符 ( 参 数列 表 ) 幸 换 列表 换行 符 


以 上 定义 中 ,“ 蔡 换 列表 ”可 缺 省 。 这 里 要 注意 的 是 ， 类 似 函 数 的 


宏 定 义 中 ， 标 识 符 与 〈 之 间 不 应 该 存在 任何 空白 符 ， 否 则 预 编 译 器 可 
能 会 将 () 作为 类 似 对 象 宏 定 义 的 替换 列表 中 的 一 部 分 


在 C 语 言 预 处 理 过 程 中 ， 替 换 列 表 会 将 当前 宏 标 识 符 给 完全 替换 
掉 。 我 们 称 两 个 奉 换 列表 是 完全 等 同 的 ， 当 且 仅 当 该 两 个 蔡 换 列表 中 
的 预 处 理 符号 (preprocessing token) 的 数量 、 次 序 、 拼 写 以 及 空白 分 
隅 符 的 数量 相同 ， 对 于 所 有 罕 日 分 隔 符 都 认为 是 等 同 的 〈 比 如 一 个 tab 
制 表 符 与 一 个 空格 符 古 完全 相同 的 ， 因 此 N 个 空格 符 与 一 个 空格 符 是 


等 同 的 ， 当 然 这 里 N 必 须 大 于 零 ) 。 


对 类 似 函 数 的 宏 (以 下 简称 为 宏 函 数 ) 的 “调用 ”与 一 般 C 函 数 调 
用 还 有 一 点 不 同 ， 即 宏 函 数 的 实 参 可 以 不 传 ， 此 时 在 安 蔡 换 时 会 使 用 
占 位 标记 (placemarker) 预 处 理 符号 来 代替 。 占 位 标记 预 处 理 符号 在 
C 语 言语 法 上 不 会 体现 出 来 ， 它 作为 C 语 言 预 处 理 辟 的 一 种 标准 实现 方 
式 进行 定义 。 


宏 定 义 的 作用 范围 是 从 它 定 义 完 的 那个 位 置 起 一 直到 当前 源 文件 
结束 ， 它 不 受 语句 块 作用 域 、 函 数 作用 域 等 影响 ， 因 为 正如 本 章 开 头 
所 提 到 的 ， 预 处 理 部 分 与 C 源 代码 正文 部 分 采用 的 是 完全 不 同 的 文法 
体系 ， 而 且 预 处 理 器 (preprocessor) 是 独立 于 编译 器 而 存在 的 。 因 此 
从 严格 意义 上 来 说 ， 我 们 在 使 用 类 似 画 数 的 宏 的 时 候 也 不 能 将 它 称 之 
为 “调用 ”， 所 以 后 续 统 一 采用 “使 用 ”。 


前 面谈 了 关于 宏 的 基本 概念 以 及 一 些 注 意 事项 之 后 ， 下 面 我 们 束 
来 谈 谈 宏 的 基本 使 用 。 


10.1.1 安 的 基本 使 用 


前 面 提 到 ，#define 用 于 定义 一 个 宏 ， 当 在 源 代码 中 使 用 宏 的 时 
候 ， 安 在 预 编译 处 理 期 间 会 被 替换 为 其 蔡 换 列表 中 的 内 容 。 下 面 我 们 
将 通过 代码 清单 10-1 举 一 些 例子 来 初步 说 明 宏 的 定义 以 及 使 用 方式 。 


代码 清单 10-1 ” 宏 的 初步 使 用 


#include <stdio.h> 


// 这 里 定义 了 一 个 缺 省 替换 列表 的 安 MY_MACRO 
#define MY_MACRO 


// 这 里 定义 了 一 个 宏 对 象 MY_MACR0O1， 其 替换 列表 为 : 100 
#define MY_MACRO1 100 


// 这 里 定义 了 一 个 宏 对 象 MY_MACR02， 其 替换 列表 为 : 10 + a 
#define MY_MACRO2 10 + 


// 这 个 宏 对 象 直接 定义 了 一 个 函数 
// 如 果 蔡 换 列 表 中 的 代码 较 长 ， 那 么 可 以 用 \ 


芭 跟 换行 条 符 来 进行 换行 


后 
// 这 里 要 注意 的 是 ,，\ 后 面 不 应 该 再 跟 其 他 空白 符 ， 而 是 要 直接 紧 跟 换行 符 
#define MY_MACRO3 static int Foo(void) { \ 
return 1; \ 


// 这 里 使 用 了 宏 MY_MACR03， 因 此 在 预 处 理 期 间 ， 这 里 会 将 MY_MACR03 扩 展 为 上 述 替 换 列 表 中 的 函数 定义 。 
// 所 以 这 里 使 用 MY_MACR03， 就 相当 于 安插 了 这 段 代 码 : 

// static int Foo(void){returni;} 

MY_MACRO3 


// 这 里 定义 了 一 个 宏 画 数 MY_SWAP， 用 于 交换 两 个 实 参 的 值 。 
// 这 里 要 注意 ，MY_SWAP 与 (之 间 不 应 该 出 现 空白 符 。 

// 这 里 假定 x 和 y 都 是 整数 类 型 
#define MY_SWAP(x, y) { int tmp = x; x=y; y= tmp; } 


static void Dummy(void) 


里 MY_MACR04 是 一 个 宏 对 象 ， 而 不 是 区 
为 MY_MACR04 与 (之 间 有 一 个 空格 ( 空 8 
尽管 定义 在 了 Dummy 画 数 的 语句 块 作用 域内 ， 
仍然 可 以 在 当前 文件 作用 域 中 任何 位 置 使 
#define MY_MACRO4 (a, b) 


~ 
™ 
' 亨 几 团 几 


int main(int argc, const char * argv[]) 


// 在 预 处 理 期 间 ，MY_MACR0 的 替换 不 包含 任何 预 处 理 
// MY MACRO1 会 会 被 自动 替换 为 100 
int a = MY_MACRO MY_MACRO1; 


Ee 
< 


// 在 预 编译 处 理 期 间 ，MY_MACR0O2 会 被 自动 替换 为 190 + a， 
// 因此 整个 表达 式 在 编译 前 会 变 为 : int b = 10 + a * 3 
int b = MY_MACRO2 * 3; 


// 这 里 a 的 值 为 109，b 的 值 为 l0 + a * 3 等 于 310 
printf("a = %d, b = %d\n", a, b); 


// 这 里 直接 调用 了 了 Foo 函数 ， 由 于 在 main 画 数 上 已 经 使 用 了 宏 MY_MACR0O3， 
// 所 以 它 在 预 处 理 阶段 扩展 后 ， 被 其 换 成 了 对 Foo 画 数 的 定义 

a = Foo()， 

printf("a = %d\n", a); 


// 这 里 使 用 了 宏 函 数 MY_SWAP， 将 对 象 标识 符 a 和 b 作 为 其 实 参 传 入 ， 
// 此 时 预 处 理 器 在 扩展 时 就 会 将 MY_ SWAP (a b ) 替 换 为 以 下 代码 : 

// { int tmp =a; a=b;b=t mp;_} 

// 各 位 可 以 注意 到 ，) 符 号 后 面 没 有 添加 分 号 ， 因 为 } 作 为 复合 语句 结尾 时 分 号 可 省 


(a, b) 
// 交换 之 后 a 的 值 为 310，b 的 值 为 1 
printf("a = %d, b = %d\n", a, b); 


// 这 里 使 用 了 MY_MACR04 宏 对 象 ， 在 预 处 理 阶段 进行 扩展 时 会 变 为 : a = (a，b); 
// 因此 ， 这 条 表示 式 语句 会 将 对 象 b 的 值 赋 给 对 和 象 a 。 
// 此 外 ， 尽 管 MY_MACR04 定 义 在 了 Dummy 男 数 内 ， 但 仍然 可 以 在 main 画 数 中 使 
a = MY_MACRO4; 


// 这 里 会 输出 OK 
if(a == b 
puts("OK!"); 


// 错误 的 宏 定义 ， 在 # 符 号 之 前 不 允许 出 现 除 空白 符 之 外 的 任何 其 他 字符 
MY_MACRO #define ERROR_MACRO 


// 以 下 宏 定义 没 问 题 ， J 个 午 # 之 用 和 有 空 符 o 
// # 与 define 之 间 人 允许 存在 除了 换行 符 以 久 的 J 其 他 空白 符 
# define OK_MACRO 


代码 清单 10-1 中 所 展示 的 宏 定 义 与 宏 准 换 尽管 不 算 复 洒 ， 但 已 经 
能 充分 呈现 出 宏 定义 的 形式 以 及 宏 玲 换 后 的 代码 样式 。 正 如 本 书 第 
章 所 提 到 的 ，C 语 言 编译 恬 在 对 C 源 代码 编译 前 需要 先 做 一 次 预 编译 ， 
也 束 古 预 处 理 。 在 预 编译 阶段 会 将 预 处 理事 符 号 全 部 奉 换 为 它 所 定义 
的 藻 换 列表 中 的 内 容 ， 同 时 合并 多 余 的 空白 符 。 在 代码 清单 10-1 中 我 
们 可 以 看 到 ， 在 替换 过 程 中 ， 替 换 列表 中 的 任 一 符号 (除了 某 些 被 合 
并 的 空白 符 之 外 ) 都 会 得 到 保留 ， 且 原封 不 动 地 替换 到 即将 编译 的 源 
代码 中 。 


当然 ， 除 了 我 们 在 源 代 码 中 显 式 定义 宏 之 外 ， 编 译 器 一 般 也 会 提 
供 全 局 的 宏 定 义 。 比 如 ， 当 我 们 在 使 用 GCC 或 Clang 编 译 器 时 ， 可 以 使 
用 编译 选项 -D， 后 面 紧 跟 所 要 定义 的 宏 名 ， 然 后 可 跟 = 来 指定 该 宏 的 
替换 列表 。 比 如 ，-DMY_MACRO=10 这 个 命令 选项 (command 
option) 指定 了 定义 一 个 全 局 的 窑 MY_MACRO， 并 且 该 宏 的 替换 列表 


为 一 个 彰 量 整数 10。 


10.1.2” 宏 定义 中 的 # 操 作答 


在 一 个 宏图 数 定义 中 ， 如 果 在 礁 换 列表 中 使 用 # 后 面 跟 形 参 名 ， 那 
么 在 宏 替 换 时 可 以 将 此 形 参 部 分 所 对 应 的 实 参 内 容 以 字符 串 字 面 量 的 
形式 表示 。 在 使 用 这 种 宏 函 数 时 ， 在 作为 实 参 的 预 处 理 符号 中 的 每 个 
空 日 符 部 会 在 预 处 理 时 作为 字符 串 子 面 量 中 的 一 个 空格 符 。 在 实 参 
中 ， 第 一 个 预 处 理 符号 之 前 的 空 日 符 以 及 预 处 理 符 号 之 后 的 空 日 符 都 
会 在 预 处 理 时 被 删除 。 其 他 情况 下 ， 实 参 中 每 个 预 处 理 符号 的 原始 拼 
写 都 会 你 留 在 宏 兰 换 之 后 的 字符 串 子 面 量 中 ， 除 非 出 现 转 义 字符 需要 
处 理 。 如 琳 宏 若 换 后 的 结果 不 是 一 个 有 效 的 字符 串 字 面 量 ， 那 么 结果 
征 未 定义 的 。 


代码 清单 10-2 展 示 了 宏 定 义 中 # 操 作 符 的 使 用 方法 以 及 效 采 。 


代码 清单 10-2 ” 宏 定 义 中 # 操 作 和 从 的 使 用 


#include <stdio.h> 
#include <string.h> 


// 这 里 定义 ] 的 带 了 # 操 作 符 
// 这 里 # 与 x 之 间 有 一 个 空格 ， 这 是 合法 的 ， 
#define MY_MACRO1 (Xx) # XxX 


一 个 简 符 的 宏 MY_MACRO1。 


了 #X 的 效果 一 至 


这 个 带 有 两 个 形 参 的 宏 画 数 ， 


耐量 与 


定义 ] 
// 实 撕 列 天 是 将 当下 参 世 措 人 的 符 各 作为 字符 
然后 再 与 第 二 个 实 参 所 指定 的 符号 作为 字符 串 字 面 上 
#define MY_MACRO2(x, y) #x "\n" #y 


全 人 


int main(int argc, const char * argv[]) 


// 这 里 的 MY_MACRO1(19ab) 会 被 替换 为 "10abn" 
const char *s = MY_MACRO1(10ab ) ; 
printf("The literal is: %s\n", Ss); 


// 这 里 字符 串 比 较 结果 是 相同 的 
If(Sstrcmp(S，"10ab" ) == 
puts("Equal!"); 


// 对 于 # 操 作 符 所 作用 的 形 参 对 应 的 实 参 , 
// 同时 ， 这 里 的 \ 符 号 在 宏 幸 换 为 字符 串 
s = MY_MACRO1( ) 


// 这 里 字符 串 比 较 结 果 是 相同 的 
if(strcmp(s, "10\"ab\\n\"") == 0) 
puts("Equal!"),; 


I \ 湛 
时 
人 
过 册 
和 
一 全 


个 换行 符 # 


符 都 会 被 删除 ， 


// 这 里 尽管 第 一 个 实 参 中 有 一 个 人 号 ， 但 它 被 包围 在 圆 括号 中 ， 因 此 不 作为 实 参 分 隔 符 。 

// 同样 在 第 二 个 参数 中 的 加 号 在 中 ， 它 作 为 一 个 字符 token， 因此 也 不 作为 实 参 分 隔 符 。 
s = MY_MACRO2( (123abc, 45;'0'), [1a2b3c:?','=]); 

printf("string is: %s\n™, s); 

// 这 里 第 二 个 实 参 传 的 是 不 含 任何 预 处 理 符号 的 实 参 ， 这 里 仅 用 一 个 逗号 作为 分 隔 符 。 

// 此 时 ，MY_MACRO2(abcd， ) 会 被 蔡 换 为 "abcdN\n"， 而 忽略 后 续 与 #y 的 替换 与 拼接 

// y 形 参 对 应 的 实 参 不 包含 任何 预 处 理 符号 ， 因 此 它 用 皇位 标记 害处 把 和 和 守 号 代替 ， 

// 在 宏 着 换 的 最 后 阶段 # 与 5 位 标记 预 处 理 符号 的 拼接 被 完全 移 除 

s = MY_MACRO2(abcd, ); 

printf("s = %s\n", s); 

// 这 里 与 上 述 代码 类 似 ， 只 不 过 第 一 个 实 参 作为 不 含 任何 预 处 理 符 号 的 实 参 ， 

// 这 里 仅 十 一 个 逗号 作为 参数 分 隔 符 使 用 。MY _MACR02(，abcd) 这 里 会 被 替换 为 "\nabcd" 
s = MY_MACRO2(, abcd); 

printf("s = %s\n", s); 

// 以 下 宏 实 参 是 非法 的 ， 由 于 它 不 是 一 个 有 效 的 预 处 理 符 号 ， 

// 由 于 出 现 了 一 个 '， 但 没有 找到 另 一 个 ' 与 之 匹配 

// s = MY_MACRO1(123'p); 


代码 清单 10-2 详 细 描 述 了 宏 定义 中 # 操 作 符 的 使 用 方式 。 


出 了 预 处 理 符 号 (preprocessing token) 的 概念 。 
清单 10-2 中 在 main 函 数 中 作为 宏 的 实 参 的 符号 


还 9 
。 我们 可 以 看 到 ， 代 三 
(token) 非常 丰富 ， 庄 


如 10ab， 它 在 C 语 言 一 般 源 代码 中 压根 吏 不 是 一 个 合法 的 标识 符 ， 也 
不 是 一 个 合法 的 数字 字面 量 ， 但 它 却 是 一 个 合法 的 预 处 理 符号 ， 因 此 
可 以 作为 宏 函 数 的 实 参 。 


C 语 言 标 准 规定 了 哪些 元 素 可 作为 预 处 理 符号 ， 哪 些 不 能 。 下 面 
列 出 可 作为 预 处 理 符号 的 元 素 : 


SE 
-标识 符 ; 


预 处 理 数字 


所 有 非 空 日 字符 ， 并 且 它 们 不 能 是 以 上 提 到 的 符号 。 


因此 ， 像 代码 清单 10-2 中 的 123'p 束 不 古 一 个 有 效 的 预 处 理 符 号 ， 
因为 123p 既 不 是 一 个 合法 的 预 处 理 数字 ， 也 不 是 一 个 合法 的 字符 党 
量 ， 所 以 在 ' 后 面 必须 再 要 出 现 一 个 '， 以 至 于 能 构成 一 个 完整 的 合法 字 
符 钊 量 才 算 是 一 个 有 效 的 预 处 理 符 号 ， 也 束 是 说 123p' 台 是 一 个 合法 的 
预 处 理 符号 了 。 而 像 123\p 这 种 也 不 属于 有 效 的 预 处 理 符号 ， 因 为 \ 只 


能 作为 字符 转 义 符号 使 用 ， 一 般 不 作为 他 用 。 如 采 宏 范 数 实 参 中 含有 
去 号 ， 那么 必须 注意 ， 应 该 要 用 圆 括 号 围 起 来 ， 否 则 逗号 将 作为 实 参 


此 外 ， 在 代码 清单 10-2 中 我 们 也 提 到 了 在 使 用 宏 函 数 时 传 入 缺 省 
实 参 的 形式 ， 比 如 MY_MACRO2 (abcd, ) 以 及 MY_MACRO2 (， 
abcd) 。 此 时 ， 缺 省 的 寡 函 数 实 参 在 宏 替 换 时 会 移 用 占 位 标记 预 处 理 
符号 代替 ， 然 后 与 它 前 后 其 他 预 处 理 符 号 进行 拼接 。 比 如 像 
MY_MACRO2 (abcd，) ， 在 宏 替 换 开 始 前 就 好 比 : 
#abcd"\n"#placemarker; 在 区 换 后 ， 孝 lacemarker 将 被 完全 移 除 ， 所 以 
结果 字符 串 为 "abcd\n"。 


10.1.3 ”安定 义 中 的 彬 操作 符 


在 宏 函 数 定义 中 ， 如 果 在 替换 列表 中 含有 失 操 作 符 ， 并 且 检 操作 

和 从 的 前 面 或 后 面 跟 一 个 该 宏 函 数 的 一 个 形 参 ， 那 么 在 宏 蔡 换 时 ， 该 形 

参 用 其 相应 实 参 的 预 处 理 符 号 序列 进行 蔡 换 。 如 果 在 宏 兰 换 时 ， 相 应 

的 实 参 没有 预 处 理 符号 ， 那 么 形 参 将 用 一 个 “ 占 位 标记 ” 预 处 理 符 号 进 
J 替换 。 


~ 


人 简单 来 说 ， 撩 操作 符 起 到 的 作用 是 将 宏 函 数 的 形 参 与 蔡 换 列表 中 
的 内 容 完 全 融合 起 来 。 比 如 说 ， 我 们 要 定义 一 个 宏 画 数 ， 使 得 该 形 参 


能 与 10 拼 接 在 一 起 ， 那 么 我 们 可 以 用 #define CONCAT (x) x##10。 这 
样 在 宏 替 换 时 ， 相 应 实 参 所 对 应 的 预 处 理 符 号 能 与 10 完 全 融 为 一 体 。 

比如 使 用 CONCAT (32) 之 后 ， 它 就 会 被 蔡 换 为 3210。 一 个 占 位 标记 
预 处 理 符 号 与 一 个 非 占 位 标记 预 处 理 符号 的 拼接 ， 结 果 为 那个 非 占 位 
标记 预 处 理 符号 。 


操作 和 从 与 # 操 作答 不 同 ， 检 操作 和 从 不 仅 可 作用 于 宏 函 数 形 参 ， 而 
且 也 可 用 于 在 蔡 换 列表 中 将 其 前 后 两 个 预 处 理 符 号 序列 拼接 在 一 起 。 
因此 类 操 作 符 的 适用 范围 比 # 更 广 ，# 操 作 符 的 操作 数 只 能 是 宏 范 数 形 


[© 


Dy 


代码 清单 10-3 展 示 了 检 操 作 符 的 一 些 基本 用 法 。 
代码 清单 10-3” 宏 定义 中 的 检 操 作 符 


#include <stdio.h> 


// 定义 了 一 个 宏 函 数 MY_MACRO1， 功 能 是 将 形 参 Xx 对 应 的 实 参 预 处 理 器 符号 序列 与 1 拼接 在 一 起 
#define MY_MACRO1(x) x ## 10 
// 定义 了 一 个 宏 函 数 MY_MACR02， 功 能 是 将 Ox 与 形 参 x 对 应 的 实 参 预 处 理 器 符号 序列 拼接 在 一 起 
#define MY —MACRO2 (x) OX ## X 
// 定义 了 一 个 宏 画 数 MY MACR03， 功 能 是 将 形 参 x 对 应 的 实 参 预 处 理 器 符号 序列 与 1 拼接 在 一 起 
// 后 面 再 加 上 将 9x 与 参 y 对 应 的 实 参 预 处 蛙 符 号 序列 拼接 在 一 起 的 数 

#define MY MACRO y) x##10 + Ox##y 


// MY_MACR04 是 一 个 宏 对 象 ， 它 直接 表示 ++ 操 作 符 
#define MY_MACRO4 十 ## 十 


// 这 里 定义 了 宏 函 数 CONCAT， 将 x 与 y 对 应 的 实 参 预 处 理 各 
#define CONCAT(x, y) X ## y 


J 


序列 拼接 在 一 起 


必 
3 


int main(int argc, const char * argv[]) 


// 这 里 的 MY_MACRO1(32) 将 被 蔡 换 为 3210 
int a = MY_MACRO1(32); 

// 这 里 将 打印 出 3210 

printf("a = %d\n", a); 


// 这 里 对 MY_MACR01 的 实 参 传递 不 包含 任何 预 处 理 符号 的 实 参 序列 ， 
// 这 样 使 得 这 里 的 MY MACRO1 宏 丽 数 最 终 被 蔡 痪 为 1 


// 形 参 x 用 一 个 占 位 标记 预 处 理 符 代 蕉 。 

// 占 位 标记 预 处 理 符 与 10 ( 非 占 位 标记 预 处 理 符 ) 拼接 ， 结 果 就 是 10 
a = MY_MACRO1(); 

printf("a = %d\n", a); 


NS 


| 


FE 


| 


// 这 里 的 MY_MACRO2(64) 将 被 蔡 换 为 0x64 
a = MY_MACRO2(64); 

// 这 里 将 打印 出 100 

printf("a = %d\n", a); 


// 这 里 的 MY_MACR03(19，16 ) 将 被 替换 为 19019 + 0x16 
a = MY_MACRO3(10, 16); 

// 这 里 将 打印 出 1032 

printf("a = %d\n", a); 


// 这 里 的 MY_MACR0O4 将 被 替换 为 ++， 
// 因此 这 条 语句 就 相当 于 : a++; 

a MY_MACRO4; 

// 这 里 将 打印 出 1033 

printf("a = %d\n", a); 


// 这 里 CONCAT(an， obj ) 将 被 替换 为 anobj ， 
// 从 而 这 里 声明 了 一 个 名 为 anobj 的 int 类 型 对 象 
Int CONCAT(an, obj); 


接 引 用 anobj 标 识 符 


代码 清单 10-3 展 示 了 撩 操 作 符 的 典型 使 用 方式 。 我 们 上 面 已 经 讲 
解 了 # 与 检 操 作 符 ， 并 且 讲 了 宏 的 基本 使 用 方式 。 下 面 我 们 将 进一步 讲 


解 宏 下 换 ， 同 时 将 # 操 作 符 与 挫 操 作 符 结合 起 来 进行 描述 。 


10.1.4” 宏 替换 


本 市 将 更 详细 地 摘 述 宏 准 换 。 首 先 ， 在 同一 文件 作用 域内 ， 不 能 
出 现 两 个 相同 名 称 的 宏 标 识 符 ， 除 非 这 两 个 宏 标 识 符 的 奉 换 列表 完全 
等 同 。 也 束 是 说 相同 的 安定 义 可 以 出 现 多 次 。 


在 宏 定义 中 ， 兰 换 列表 之 前 的 空白 符 以 及 蔡 换 列表 之 后 的 空白 符 
全 都 不 作为 蔡 换 列表 中 的 一 部 分 。 


当 使 用 一 个 宏 时 ， 宏 实例 会 用 奉 换 列表 中 的 预 处 理 符号 进行 大 

换 ， 完 了 之 后 预 处 理 器 还 会 再 次 扫 摘 更 多 的 宏 名 。 也 束 古 说 ， 一 个 宏 
定义 中 可 以 引用 男 外 一 个 已 定义 的 宏 ， 因 此 预 处 理 紫 会 不 断 闪 代 解析 
蔡 换 列表 中 所 有 出 现 的 宏 ， 直 到 把 它们 全 都 解析 完成 。 当 预 处 理 恬 识 
别 到 使 用 一 个 宏 函 数 时 ， 其 形 参 会 用 实 参 进行 蔡 换 。 替 换 列表 中 的 形 
参 ( 若 不 作为 # 或 棒 的 操作 数 ) 在 该 宏 的 蔡 换 列表 中 所 包含 的 所 有 宏 名 
全 都 被 扩展 之 后 ， 才 用 相应 的 实 参 进行 奉 换 。 在 做 实 参 蔡 换 之 前 ， 
个 实 参 的 预 处 理 符号 需要 进行 完全 的 宏 奉 换 。 也 就 古 说 ， 宏 函数 的 大 
换 顺 序 是 先 处 理 蔡 换 列表 中 出 现 的 # 与 雁 操 作 符 ， 然 后 对 替换 列表 中 所 
出 现 的 安 进行 展开 替换 ， 接 着 检查 实 参 是 否 引 用 了 安 ， 如 有 果 引 用 了 则 
先 对 所 有 引用 了 宏 的 实 参 进行 完全 的 宏 蔡 换 ， 最 后 才 将 奉 换 列表 中 出 
现 的 形 参 替换 为 宏 扩 展 后 的 实 参 对 应 的 预 处 理 符号 。 


在 对 安 函 数 调用 过 程 中 ， 当 替换 列表 中 的 所 有 形 参 已 被 奉 换 ， 并 
且 对 # 与 棒 的 处 理 也 完成 之 后 ， 所 有 占 位 标记 预 处 理 符号 被 移 除 ， 然 后 
所 获得 的 预 处 理 符号 序列 再 被 重新 扫描 。 


宏 定 义 与 瑟 数 定义 不 同 ， 不 能 做 “递归 式 ” 定 义 ， 也 束 是 说 在 一 个 
宏 的 蔡 换 列表 中 不 能 出 现 所 定义 宏 目 映 的 标识 符 ， 此 外 , “间接 递归 
式 ” 定 义 也 不 行 ， 比 如 宏 A 的 兰 换 列表 中 引用 了 宏 B， 而 宏 B 的 替换 列表 


中 又 引用 了 宏 A。C 语 言 标准 指出 ， 发 生 以 上 这 两 种 情况 时 宏 名 不 会 被 
蔡 换 。 这 些 没 被 蔡 换 的 宏 名 预 处 理 符号 对 于 后 续 的 蔡 换 也 不 再 可 用 。 
最 后 要 提 到 的 一 点 是 ， 如 采 在 安 蔡 换 之 后 ， 恰 好 出 现 了 诸如 
#define 这 种 结果 ， 那 么 出 现 这 种 预 处 理 符 号 序列 不 会 作为 预 处 理 指示 


行 处 理 ， 即 便 它 是 一 个 “良好 定义 的 ” 宏 ， 此 时 编译 器 (C 语 言 实 
现 ) 也 会 报错 。 


代码 清单 10-4 进 一 步 插 述 了 宏 蕉 换 的 操作 次 序 以 及 一 些 需 要 注意 
的 地 方 。 


代码 清单 10-4” 宏 玲 换 的 进一步 描述 


#include <stdio.h> 


// 这 里 先 定义 一 个 宏 函 数 MY_MACRO1 
#define MY_MACRO1(x) X + X## 0 


// 这 里 定义 的 MY_MACR01 与 上 述 定 义 的 完全 等 同 ， 因 此 是 允许 的 
#define MY_MACRO1(X) X+ x ## 0 


// 这 里 定义 LITERAL， 将 形 参 所 对 应 的 实 参 预 处 理 符号 序列 进行 字符 串 字 面 量 化 
#define LITERAL(X) #X 


// 这 里 定义 宏 画 数 MY_MACR02， 其 替换 列表 引用 了 宏 画 数 LITERAL 
#define MY_MACRO2(X) LITERAL (x) 


// 这 里 定义 了 一 个 用 于 拼接 的 宏 画 数 CONCAT， 
// 它 将 x 与 y 所 对 应 的 实 参 预 处 理 符号 进行 拼接 ， 然 后 再 拼接 一 个 ELLO 
#define CONCAT(x, y) X ## yy ## ELLO 


int main(void) 


// 这 里 ，MY_MACRO1(10) 会 被 替换 为 : 10 + 100 
int a = MY_MACRO1(10); 
printf("a = %d\n", a); 


// 这 里 是 对 宏 LITERAL 的 使 用 : LITERAL (MY MACRO1( 20)), 

// 第 一 步 就 是 先 对 LITERAL 进 行 宏 蔡 换 ， 下 接 就 是 #xX， 

// 由 于 对 # 操作 符 的 处 理 次 序 比 实 参 中 出 现 安 名 进行 堆 换 的 次 序 要 优先 
// 所 以 这 里 的 第 1 步 完 成 后 直接 做 第 2 步 ， 将 实 参 MY _ MACRO1( 20 ) 玲 换 
// 替换 后 相当 于 : # MY_MACRO1(20), 因此 最 后 的 硅 换 结果 就 是 字符 唱 
const char *s = LITERAL(MY_MACRO1(20 ) ) ， 

printf("s = %s\n", s); 


尹 参 X 0° 
"MY_MACRO1 (20)" 


里 对 宏 MY_MACR02 的 使 用 : MY_MACRO2(MY_MACRO1(20 ) ) ， 


这 
// 第 一 步 先 对 MY_MACR02 进 行 宏 交换， 结果 为 LITERAL (x)， 由 于 这 里 不 涉及 
// # 与 ## 操作 符 ， 然 而 却 存 在 宏 名 LITERAL， 因 此 需要 进一步 对 它 扩展 
// 所 以 第 二 步 就 是 宏 展开 LITERAL (xX)， 得 到 #x 。 
// 这 里 需要 大 家 注意 ， 由 于 这 里 的 #xX 不 是 MY_MACRO2 宏 里 的 替换 列表 中 的 ， 
// 而 是 被 替换 扩展 出 来 的 ， 因 此 此 时 不 需要 直接 对 # 符号 做 处 理 。 
// 所 以 第 三 步 就 是 对 实 参 中 出 现 的 宏 MY_MACR0O1 进 行 替换 ; 


// 对 实 参 MY_MACR01(29 ) 进 行 宏 蔡 换 后 结果 为 :， 29 + 299， 

// 然后 第 四 步 将 扩展 后 的 实 参 20 + 200 传 给 形 参 Xx， 得 : #<20 + 200>。 
// _ 最 终 获得 字符 串 5 面 量 一 "20 + 200" 

Ss = MY_MACRO2(MY_MACRO1(20) ) ; 

printf("s = %s\n", s); 


// 下面 这 个 对 CONCAT 的 使 用 结果 会 特 换 为 :#define ELLO， 


// 使 得 宏 替换 结 预 编译 指示 符 ， 这 会 导致 编译 报错 。 
CONCAT(#, gel ney 


人 


#define def 100 
#define H abcd 


// 这 里 对 宏 MY_MACR02 的 使 用 与 上 述 类 似 ， 
起 可 
口 


// 第 一 步 先 对 MY_MACR02 进 行 宏 替 换 ， 结 果 为 LITERAL(X ) ; 


// 第 二 步 是 再 对 LITERAL 进 行 宏 展开 ， 得 到 #x; 
// 第 三 步 对 实 参 CONCAT(if，def H) 进 行 宏 蔡 换 ， 
下 


: X ## y ## ELLO ; 
// 于 这 里 CONCAT 宏 的 过 负 列 表 含 有 ## 操 FE 符 ， 
// 因此 不 会 对 实 参 宏 def 和 H 进 行 扩展 
// 所 L 第 站 步 将 实 会 13? 和 def H 替 换 形 参 之 后 ， 结 果 为 ifdef HELLO ; 
// 第 五 步 将 及 后 的 实 参 传 给 形 参 X， 得 : #<ifdef HELLO> ; 

A/ 最 终 获 得 字符 串 字面 量 一 "ifdef HELLO" 

s = MY _MACRO2(CONCAT(if， def H)); 

printf("s = %s\n", s); 


代码 清单 10-4 详 细 介 绍 了 宏 蔡 换 的 操作 步 怠 ， 相 信 读 者 读 到 这 里 
对 对 宏 定 义 与 宏 替 换 有 了 更 深层 的 理解 了 。 此 代码 中 的 某 些 注释 中 
含有 #<> 的 符号 ， 这 里 的 <> 表 示 将 其 中 的 预 处 理 器 符号 作为 一 个 整 
体 ， 比 如 #<ifdef HELLO>， 表 示 将 ifdef HELLO 预 处 理 符号 序列 作为 整 
体 蔡 换 掉 形 参 。 否 则 ##fdef HELLO 的 语义 跟 #<ifdef HELLO> 是 不 一 样 
的 。 


10.1.5 ”可 变 参 数 的 宏 定义 


从 C99 标 准 起 ，C 语 言 开始 加 入 了 不 定 参 数 个 数 〈 又 称 可 变 参 数 ) 
的 宏 定 义 。 与 可 变 参 数 的 函数 类 似 ， 定 义 可 变 参数 的 宏 画 数 时 ， 宏 的 
形 参 列表 使 用 ... 来 表示 。 而 在 蔡 换 列表 中 ， 用 _VA_ARGS_ (前 后 各 
有 两 条 下 划 线 ) 表示 形 参 ... 对 应 的 参数 内 容 。 比 如 : #define 
VARIADIC_MACRO (...) printf (” VA_ARGS _) 。 这 里 将 
VARIADIC_MACRO 宏 定义 为 printf 函 数 ， 同 时 可 变 参 数 部 分 用 
_VA_ARGS_ 表示。 在 使 用 可 变 参数 安 的 时 候 ，.… 所 对 应 的 实 参 列 表 
将 完全 等 同 地 取代 替换 列表 中 的 _VA_ARGS_ 部 分 。 比 如， 如 果 我 们 
使 用 上 述 定 义 的 VARIADIC_MACRO (“The integer is: %d\n”, 

100) ; ， 那 么 在 做 宏 替 换 之 后 束 成 为 printf (“The integer is: %d\n”， 
100) ; 。 


这 里 各 位 要 当心 的 是 ， 一 般 我 们 在 定义 可 变 参 数 宏 的 时 候 ， 参 数 
列表 直接 使 用 (...) ， 而 不 是 在 它 前 面 再 加 某 个 形 参 ， 比 如 : #define 
VARIADIC_PRINT (str，...) print (str， VA_ARGS_) 这 种 形式 。 
由 于 ... 部 分 的 可 变形 参 可 以 不 传 任何 实 参与 之 对 应 ， 比 如 
VARIADIC_PRINT (“Hello”) ; 像 这 个 宏 在 做 宏 蔡 换 时 会 变 为 :printf 
(“Hello”"，) ; 。 请 大 家 注意 ， 在 实 参 "Hello” 后 面 还 有 一 个 逗号 ! 
为 _VA_ARGS_ 表示 的 是 .部 分 ， 在 替换 列表 print (str， 

_VA ARGS ) 中 , 在 _VA_ARGS_ 之 前 有 一 个 逗号 作为 printf 函 数 
实 参 分 隔 符 。 但 是 替换 列表 在 预 处 理 阶段 不 会 解析 此 语义 ， 预 处 理 
只 会 解析 宏 本 喘 的 参数 分 隔 符 (比如: VARIADIC_PRINT 


..) 中 的 逗号 作为 其 
”VA ARGS _ 之 前 的 逗号 


(str, 


形 参 分 隔 符 ) 


仍然 保留 ， 而 这 


,所 以 在 宏 符 换 之 
会 导致 编译 错 i 


后 ， 


全 使 用 


安 的 时 候 可 传 缺 省 的 实 
函数 调用 中 每 个 实 参 运 号 


唱 


代码 清单 10-5 展 示 了 可 变 参 


NS 


党 


代码 清单 10-5 数 宏 定 


可 变 参 ; 


#include <stdio.h> 


y ”定义 ] 上 各 有 可 变 参数 的 宏 VARIADIC_MACRO1， 


参 内 容 ， 但 


数 安 的 一 


在 函数 调用 的 时 候 却 不 能 这 么 做 ， 


分 隔 符 后 必须 跟 一 个 对 应 的 表达 式 作 为 实 


些 用 法 。 


义 与 使 用 


替换 列表 是 将 整个 实 参 列表 内 容 作为 字符 串 
* 然后 与 "The string is: "进行 拼接 

*/ 

#define VARIADIC _ MACRO1(...) 


* 定义 了 带 有 可 变 参 数 的 宏 VARIADIC_MACRO02， 


sl: 


"The string is: 


# VA ARGS _ 


替换 列表 是 将 实 参 列表 与 71009 结合， 然后 用 ( 


..) (_VA 


#define VARIADIC MACRO2(. 


We 


和 


] 宏 VARIADIC_MACRO3， 


_ARGS 


) 包 围 起 来 


韦 


## 100) 


条 列表 是 先 执 和 
( ) 包 围 起 


#define VARIADIC MACRO3(a, 


区 参 a 对 应 的 对 


J 
处 


书 | 


..) 


(a 


int main(void) 


// 这 里 VARIADIC_MACRO1(Good luck!) 将 


// "The string is: 
const char *s = VARIADIC MACRO1(GoO 
// 输出 : s = The string is: Good lu 
printf("s %s\n", Ss); 


" "Good luck!" 


<Say "Hi"!, 


// 这 里 实 参 列表 
// 并 且 通过 4 损人 
S = VARIADIC MACRO1(Say "Hi"!, 
// 输出 : s = The string is: 


printf("s = %s\n", s); 


Say "Hi 


达 式 ， 然 后 执 


10) 


会 被 替换 为 : 


od luck!); 
ck! 


Byebye，Thank you 作 为 一 个 整体 ， 
竺 被 替换 为 "Say \"Hi\"!， 


Byebye, Thank you" 


Byebye, Thank you); 


/ Byebye, Thank you 


// 这 里 使 用 VARIADIC_MACR01 宏 的 时 候 没 


有 传人 有 


E 何 实 参 


// 因 去 符 浴 计 诊 二 "he string is; ™i 
S = VARIADIC_ MACRO1( )，; 


这 


单一 的 字符 


四 | 


// 输出 : S 
printf("s 


The string is: 
%s\n", Ss); 


// 这 里 VARIADIC_MACRO02(290 ) 将 被 替换 为 : (20100 ) 
int a = VARIADIC_MACRO2(20) ; 

// 输出 : a = 20100 

printf("a = %d\n", a); 


// 这 里 VARIADIC_MACR02(19，20，30) 将 被 替换 为 : (10，20，30100)， 
// _ 很 明 吕 它 是 一 个 逗号 表达 式 。 和 而 整 条 语句 为 ，a = (10, 20, 30100); 

a = VARIADIC_MACRO2(10, 20, 30); 

// 输出 : a = 30100 

printf("a = %d\n", a); 


int b = 0; 


// 这 里 VARIADIC_MACRO3(++b， -29 + ) 将 被 巷 换 为 (++b - 20 + 10), 
// 其 中 第 一 个 实 参 为 ++b， 语 面 的 -29 + 作为 可 变 参数 的 实 参 

a = VARIADIC MACRO3(++b, -20 + ); 

// 输出 : a = -9, b=1 

orn ua = %d, b = %d\n", a, b); 


// 这 里 缺 省 VARIADIC_MACRO03 的 第 一 个 实 参 ， 可 变 实 参 部 分 为 30 * ， 
// 因此 VARIADIC_MACR03(，30 * ) 被 替换 为 : (30 * 10) 

a = VARIADIC MACRO3(, 30 * ); 

// 输出 : a = 300 

printf("a = %d\n", a); 


// 这 里 同时 缺 省 了 第 一 个 实 参 以 及 可 变 参 数列 表 的 实 参 ， 
// 因此 VARIADIC_MACR03( ， ) 被 替换 为 : (19 ) 

a = VARIADIC MACRO3( ，); 

// 输出 : a = 10 

printf("a = %d\n", a); 


代码 清单 10-5 中 我 们 可 以 清晰 地 看 到 ， 在 使 用 可 变 参数 宏 时 ， 可 
变形 参 对 应 的 实 参 吓 连 同 实 参 逗号 分 隔 符 一 同 换 入 蔡 换 列表 中 去 的 ， 
取代 VA_ARGS_ 部分。 在 蔡 换 完 之 后 ， 如 果 表 达 式 有 语法 错误 则 会 
编译 报错 ， 替 换 列 表 在 预 编 译 时 是 不 做 语法 分 析 的 。 


10.2 C 语 言 中 预定 义 的 安 


C 语 言 标准 指出 了 C 语 言 实现 ( 即 C 语 言 编译 工具 ) 要 求 必 须 实现 
的 预定 义 安 以 及 可 选 实 现 的 预定 义 安 。 所 谓 预 定义 宏 即 不 是 由 C 语 言 
程序 员 目 己 定义 ， 而 是 由 编译 工具 预先 已 经 定义 好 的 宏 。 


C 语 言 中 的 预定 义 宏 分 为 二 类 : 


C 语 言 标准 强制 要 求 预定 义 的 安 ， 


-环境 安 ， 它 可 选 实 现 的 预定 义 安 ; 


:条件 特征 宏 ， 这 也 是 实现 可 选 实现 的 。 


当然 除 此 之 外 ，C 语 言 实现 可 根据 当前 平台 环境 等 因素 目 己 定义 


特定 的 预定 义 安 。 


10.2.1 C 语 言 强制 要 求 的 预定 义 宏 


我 们 在 写 C 语 言 代码 的 时 候 出 于 调试 或 备注 的 目的 ， 往 往 想 方便 
获得 当前 C 语 言 源 文件 名 、 当 前 代码 所 在 的 行 号 、 当 前 代码 所 在 的 函 
数 名 、 编 译 当 前 源 文件 时 的 时 间 日 期 等 。 因 此 ，C 语 言 标准 提供 了 以 
下 我 们 常用 的 预定 义 宏 来 方便 地 获取 这 些 信息 。 


1) _DATE_: 此 预定 义 宏 用 于 表示 当前 日 期 的 一 个 字符 串 字 面 
量 ， 其 形式 为 "Mmm dd yyyy"。 这 里 ，Mmm 是 月 份 的 缩写 ， 比 如 1 月 
是 Jan，2 月 是 Feb。 如 果 日 小 于 10， 那 么 前 面 的 一 个 d 用 一 个 空格 字符 
表示 。 所 以 ， 如 果 是 2015 年 2 月 6 日 ， DATE。_ 就 表示 为 "Feb 
22015"， 这 里 Feb 与 2 之 间 有 两 个 空格 。 


| 


2) _FILE_: 表示 当前 源 文件 名 ， 用 字符 串 字 面 量 表示 。 


3) _LINE_: 表示 当前 源 文件 的 当前 行 号 ， 用 一 个 整数 常量 表 


4) _STDC_: 它 表 示 一 个 第 量 值 ， 如 采 该 宏 的 值 为 1， 那 么 说 


明 当 前 C 语 言 实现 顺应 C 语 言 标准 。 


5) _STDC_HOSTED_: 如 果 当 前 C 语 言 实现 是 一 个 主机 端 实 
现 ， 那 么 该 预定 义 宏 的 值 为 1， 如 果 是 独立 式 实现 ， 那 么 该 预定 义 宏 的 
值 为 0。 所 谓 主 机 端 实现 是 指 当 前 C 源 代码 最 终 编译 为 当前 目标 平台 兼 
容 的 二 进 制 代码 文件 ， 随 后 可 以 连接 成 能 在 当前 目标 平台 上 可 直接 执 
行 的 可 执行 文件 。 而 独立 式 实现 类 则 比较 灵活 ， 比 如 可 以 将 当前 C 源 
代码 编译 为 一 种 中 间 代 码 ， 然 后 可 以 以 虚拟 机 的 方式 对 该 中 间 代 码 做 
解释 执行 。 


6) _STDC_VERSION_: 该 预定 义 宏 表示 一 个 整数 常量 (long 
类 型 ) ， 用 于 指明 当前 正 使 用 的 C 语 言 标 准 版 本 。 比 如 ， 如 果 当 前 用 


的 是 2011 年 12 月 发 布 的 C 语 言 标准 ， 那 么 整数 常量 为 201112L。 


7) _TIME_: 表示 当前 时 间 的 一 个 字符 串 字面 量 ， 其 形式 


为 "hh: mm: ss"。 比 如 ，22 时 55 分 30 秒 则 表示 为 "22: 55: 30"。 


除了 上 述 这 些 预 定义 宏 之 外 ， 从 C99 标 准 起 规定 ，C 语 言 实现 还 需 
要 实现 一 个 预定 义 标识 符 _ func”， 该 预定 义 标 识 符 表示 当前 函数 


名 ， 它 被 定义 为 : static const char func _[]="function-name"; 
代码 清单 10-6 展 示 了 使 用 上 壕 这 些 宏 的 示例 。 
代码 清单 10-6”C 语 言 强制 要 求 预 定义 的 宏 


#include <stdio.h> 
int main(void) 


printf("The current date is: %s\n", _ DATE  ); 

printf("The current time: %s\n", __TIME  ); 

printf("The current file is: %s\n", __FILE  ); 

printf("The current function: %s\n", __func_  ); 

printf("The current line is: %d\n", _ LINE ); 

printf("The current standard is: %ld\n", __STDC VERSION  ); 
printf("Conform standard C %d\n", __STDC_  ); 

printf("Is current hosted environment: %d\n", STDC_HOSTED_  ); 


此 外 ，C 语 言 标准 还 强制 规定 了 不 能 预定 义 _cplusplus 该 预定 义 
安 ， 如 果 此 安 被 预定 义 ， 那 么 启明 当前 编译 环境 为 C++ 语言 ， 而 不 是 C 


102 .3w 境 安 


环境 宏 主要 用 于 指明 当前 源 文件 输入 字符 编码 的 支持 情况 。 这 些 
宏 都 是 可 选 实现 ， 而 不 是 必须 实现 的 。 


1) _STDC_ISO_10646_: 该 预定 义 宏和 被 定义 为 一 个 整数 常量 ， 
形式 写 _STDC_VERSION_ 类 似 。 如 果 遵 循 的 ISO10464 是 1997 年 12 月 
发 布 的 ， 那 么 此 宏 的 值 为 199712L。 如 果 C 语 言 实现 定义 了 这 个 宏 ， 那 
么 在 wchar_t 类 型 对 象 中 存放 的 值 ， 在 Unicode 要 求 字 符 集中 的 每 一 个 
Unicode 与 该 字符 所 对 应 的 短 标识 符 具 有 相同 的 值 。Unicode 要 求 字 符 
集 由 ISO/IEC 10646 定 义 的 所 有 字符 组 成 ， 此 外 还 包括 一 些 修 改 与 技术 
勤 误 表 。 如 有 宁 C 语 言 实 现 使 用 了 其 他 编码 方式 ， 那 么 束 不 能 定义 此 


a 


太 ， 


2) _STDC MB MIGHT NEQ _ WC _: 如 果 该 预定 义 宏 的 值 为 
1， 那 么 指明 当 在 一 个 整数 字符 常量 中 用 作为 单个 字符 时 ，wchar t 类 
型 的 字符 编码 中 ， 一 些 基 本 字符 集 的 编码 值 不 需要 与 其 值 相 等 。 


3) _STDC_UTEF 16_: 如 果 该 预定 义 宏 的 整数 常量 值 为 1， 那 么 
指明 char16_t 类 型 的 值 表示 的 是 UTF16 编 码 的 。 如 果 C 语 言 实现 对 
char16_t 类 型 的 值 采 用 的 是 其 他 编码 类 型 ， 那 么 就 不 该 定义 此 宏 。 


4) _STDC_UTF_32”: 如 果 该 预定 义 宏 的 整数 常量 值 为 1， 那 么 
和 明 char32_t 类 型 的 值 是 UTF-32 编 码 的 。 如 果 C 语 言 实现 对 char32_t 类 
型 的 值 采 用 的 是 其 他 编码 方式 ， 那 么 就 不 该 定义 此 宏 。 


10.2.3 ”条 件 特 征 宏 


C 语 言 标准 中 含有 一 些 语 法 特征 是 C 语 言 编译 贷 可 选 实现 的 ， 编 译 
右 可 根据 这 些 宏 来 指明 目 己 是 否 文 持 C 语 言 中 的 一 些 可 选 实现 的 语法 
4 


1) _ STDC_ANALYZABLFE。_: 如 果 该 预定 义 宏 的 整数 常量 值 为 
1， 那 么 指明 当前 C 语 言 实 现 顺 从 C 语 言 标准 在 附录 工 中 标 出 的 运行 时 代 
码 检查 ， 这 些 代码 检查 主要 包括 数组 边界 是 否 越界 、 栈 是 否 越界 等 。 


2) _STDC IEC_559”: 如 果 该 预定 义 宏 的 整数 常量 值 为 1， 那 
么 指明 当前 C 语 言 实现 顺从 C 语 言 标 准 中 附录 F 中 标 出 的 浮 点 数 表 示 以 
及 浮 点 算术 运算 。 


3) _STDC IEC 559 COMPLEX : 如 果 该 整数 常量 值 为 1， 那 
么 指明 当前 C 语 言 实现 遵 守 C11 标 准 手 册 附 录 G 中 的 规格 说 明 (ISO/IEC 
60559 兼 容 的 复数 ) 


4) _STDC LIB EXT1 : 如 果 该 预定 义 宏 被 定义 ， 那 么 它 是 一 
个 整数 常量 ， 形 式 与 “STDC_VERSION__ 类似， 用 于 指明 当前 C 语 言 
实现 支持 C11 标 准 中 附录 K 定 义 的 扩展 〈 主 要 是 边界 检查 接口 ) 。 


5) _STDC _NO_ATOMICS _: 如 果 该 预定 义 宏 的 整数 常量 值 为 
1， 那 么 指明 当前 C 语 言 实现 不 支持 原子 类 型 (包括 _Atomic 类 型 标识 
符 ) 以 及 <stdatomic.h> 头 文件 。 


6) _STDC_NO_COMPLEX_: 如 果 该 预定 义 宏 的 整数 常量 值 为 
1， 那 么 指明 当前 C 语 言 实现 不 文 持 复数 类 型 ， 并 且 也 不 文 持 
<complex.h> 头 文件 。 如 有 果 C 语 言 实现 定 义 了 此 宏 ， 那 么 当前 实现 就 不 
该 定义 _STDC_IEC_559_COMPLEX。_ 这 个 宏 。 


7) _STDC_NO_THREADS_: 如 果 该 预定 义 宏 的 整数 常量 值 为 
1， 那 么 指明 当前 C 语 言 实现 不 支持 <threads.h> 头 文件 。 这 里 要 注意 的 
是 ，C 语 言 标准 中 没 说 有 了 此 预定 义 宏 就 不 支持 _Thread_local， 这 个 关 
键 字 仍然 可 以 被 文 持 。 


8) _STDC_NO_VLA ”: 如 果 该 预定 义 宏 的 整数 常量 值 为 1， 那 
么 指明 当前 C 语 言 实现 不 文 持 变 长 数组 ， 也 不 支持 可 变 修改 类 型 。 


10.2.4 主流 编译 硕 及 平台 预定 义 的 安 


以 下 预定 义 安 不 是 C 语 言 标准 指出 的 ， 而 是 当前 主流 桌面 平台 、 
处 理 硕 及 主流 编译 硕 可 能 文 持 的 预定 义 安 。 我 们 通过 这 些 宏 可 以 了 解 


到 当前 所 用 的 是 哪 款 C 语 言 编 译 占 ， 以 及 当前 编译 目标 环境 所 在 的 系 
统 与 所 用 的 处 理 器 架构 等 。 


1) _MSC_VER: 如 果 C 语 言 实 现 预 定义 了 这 个 宏 ， 说 明 当 前 的 编 


译 器 为 MSVC 。 


2) _GNUC_: 如 果 C 语 言 实现 预定 义 了 这 个 宏 ， 说明 当 前 的 编 
译 器 为 GCC 或 兼容 GCC 的 编译 器 。 那 么 ， 如 果 我 们 在 使 用 Clang 编 译 器 
时 ， 此 安 也 是 被 定义 的 。 


3) _clang_: 如 果 C 语 言 实现 预定 义 了 这 个 宏 ， 说明 当 前 的 编译 


右 为 Clang 编 译 器 。 


4) _i386_: 如 果 C 语 言 实现 预 定义 了 这 个 宏 ， 说 明 编 译 生 成 的 
目标 为 32 位 的 x86 处 理 器 。 


5) _x86_64 : 如 果 C 语 言 实现 预定 义 了 这 个 宏 ， 说 明 编 译 生成 
的 目标 为 x86_64 处 理 器 ， 并 运行 在 64 位 系统 模式 下 的 指令 集 。 


6) _arm : 如 果 C 语 言 实现 预定 义 了 这 个 宏 ， 说 明 编 译 生成 的 
目标 为 32 位 ARM 人 处理 器 。 


7) _arm64 ” : 如 果 C 语 言 实现 预 定义 了 这 个 宏 ， 说 明 编 译 生成 
的 目标 为 64 位 的 ARM 人 处 理 器 。 


8) ”APPLE ”: 如 果 C 语 言 实 现 预 定义 了 这 个 宏 ， 说 明 编译 生成 


的 目标 为 Apple 系 统 (包括 macOS、iOS、tvOS、watchOS 等 ) 上 的 。 


9) _unix : 如 果 C 语 言 实现 预 定义 了 这 个 宏 ， 说 明 编 译 生 成 的 
目标 是 Unix 或 与 其 兼容 的 系统 上 的 。 


10) _linux : 如 果 C 语 言 实现 预定 义 了 这 个 宏 ， 说 明 编 译 生 成 
的 目标 是 Linux 或 与 其 兼容 的 系统 上 的 。 


11) _WIN32: 如 果 C 语 言 实现 预 定义 了 这 个 宏 ， 说 明 编 译 生 成 的 


目标 是 32 位 Windows 系 统 。 


12) _WIN64: 如 果 C 语 言 实 现 预定 义 了 这 个 宏 ， 说 明 编 译 生 成 的 


目标 是 64 位 Windows 系 统 。 
13) _LP64 : 如 果 C 语 言 实现 预定 义 了 这 个 宏 并 且 其 整数 常量 


为 1， 那 么 说 明 当前 程序 运行 环境 为 64 位 系统 环境 ， 此 时 long int 类 型 
的 长 度 为 64 位 ，int 类 型 的 长 度 仍然 为 32 位 。 


10.3 条件 预 编译 


条 件 预 编 译 用 来 控制 所 要 编译 的 代码 。 当 条 件 预 编 译 中 的 条 件 为 
真 时 ， 这 段 预 编译 块 中 的 代码 参与 编译 ， 否 则 不 参与 编译 。 实 际 上 ， 
当 条 件 预 编译 的 条 件 为 真 时 ， 预 处 理 器 才 会 将 该 预 编译 块 中 的 预 处 理 
字符 序列 替换 到 源 代码 中 ， 等 待 后 续 编译 。 


控制 条 件 包含 的 表达 式 应 该 是 一 个 整数 常量 表达 式 ， 此 外 还 支持 
defined 表 达 式 。defined 表 达 式 的 形式 类 似 于 sizeof 表 达 式 ， 有 两 种 形 
式 : 


def ined 标识 符 


以 及 


def ined ( 标识 符 ) 


defined 表 达 式 只 能 与 认 f 条 件 包含 控制 语句 联合 起 来 使 用 ， 而 不 能 
单独 用 于 其 他 场合 。defined 后 面 的 标识 从 应 该 是 一 个 宏 名 ， 如 果 该 宏 
在 此 前 已 被 定义 ， 那 么 defined 表 达 式 的 值 为 1， 否 则 defined 表 达 式 的 值 
为 0。 


在 预 处 理 常量 表达 式 中 ，defined 表 达 式 可 以 参与 算术 逻辑 运算 ， 
而 且 像 ! defined 也 用 得 比较 多 ， 如 果 ! defined 后 面 的 标识 符 定 义 过 ， 
那么 表达 式 的 值 为 0， 否 则 表达 式 的 值 为 1°。 这 里 的 ! 符号 相当 于 逻辑 
运算 中 的 非 操 作 符 。 


下 面 介绍 ##f、#elif 预 处 理 指示 从， 这 两 个 预 处 理 指示 符 的 形式 都 


条 件 预 编译 组 可 六 | 
#elif 常量 表达 式 换行 符 
条 件 预 编 译 组 可 选 


#if 常量 表达 式 换行 符 
口 
可 


在 上 面 的 描述 中 ，“#if 弟 量 表达 式 ” 以 及 “#elif 常 量 表 达 式 ”后 面 必 
须 跟 一 个 换行 符 ， 而 不 能 用 其 他 符号 作为 分 隔 符 。 它 们 用 于 检查 控制 
常量 表达 式 计 算 结果 是 否 为 非 零 。 如 果 李 {f 后 面 的 季 量 表达 式 的 计算 结 
栗 不 为 零 ， 那 么 后 面 将 编译 该 条 件 预 编译 组 的 代码 。 如 有 果 李 {f 后 面 的 向 
量 表达 式 的 计算 结果 为 零 ， 且 后 面 跟 有 #elif 语 句 ， 那 么 判定 #elif 语 句 
后 面 的 稼 量 表达 式 ， 如 有 果 计 算 结果 不 为 零 ， 那 么 后 面 将 编译 该 条 件 预 
编译 组 的 代码 。#elif 的 语义 类 似 于 else 让， 只 不 过 在 预 处 理 器 中 的 #felse 
后 面 不 能 跟 任 何其 他 表达 式 和 语句 ， 只 能 跟 换行 ， 再 跟 条 件 预 编译 
组 。 所 以 ，#elif 也 可 以 用 下 述 语句 代替 : 


#else 换行 符 
#if 常量 表达 式 换行 符 
条 件 预 编译 组 可 选 


这 里 的 “常量 表达 式 ” 应 该 是 一 个 有 效 的 、 适 用 于 预 处 理 的 常量 
达 式 。 当 本 组 条 件 预 编译 组 的 条 件 包括 判定 都 结束 之 后 ， 最 后 必须 用 
#endif 来 结尾 。 其 中 ，#endif 后 面 只 能 跟 换行 符 ， 而 不 能 跟 其 他 字符 。 


此 外 ， 如 果 ##f、#elif 后 面 的 常量 表达 式 中 包含 一 个 标识 符 (在 预 
处 理 器 中 就 是 宏 ) ， 并 且 该 标识 符 在 此 时 没有 被 定义 ， 那 么 此 条 件 包 
含 的 判定 结果 即 为 “ 假 "， 其 下 面 的 条 件 预 编译 组 的 代码 不 会 参与 编 


译 。 
代码 清单 10-7 展 示 了 了 上述 几 个 控制 条 件 包含 语句 的 使 用 方式 。 
代码 清单 10-7 ##f、#elif、#else 预 处 理 指示 符 的 使 用 


#include <stdio.h> 


int main(void) 


// 这 里 3 + 5 是 一 个 非 零 整数 常量 表达 式 ， 
// 因此 下 面 预 编译 组 的 puts 夯 数 调用 表达 式 将 被 编译 


#if 3 + 5 
puts("Non-zero expression"); 
#endif 
// 这 里 做 一 次 puts 函 数 调 用 ， 而 实 参 内 容 则 根据 预 编译 条 件 来 选 
puts( 
// 这 里 #if 后 面 的 表达 式 为 9， 因此 不 会 将 "0" 编 译 进 去 
#if 0 
oOo" 
// 这 里 #e1if 后 面 的 整数 常量 表达 式 结果 为 9， 因此 后 面 的 "1" 不 会 编译 进去 
#elif 3 - 3 
La 
//_ 由 于 上 述 条 件 判定 均 失 败 ， 所 以 编译 #else 下 面 的 预 编译 组 ，"2" 
#else 
3 
#endif 
); // 因此 这 里 将 输出 2 


// 这 里 定义 了 宏 HELLO 
#define HELLO 


// 这 里 判定 的 是 倘若 定义 了 HELL0O 这 个 宏 ， 则 编译 下 面 的 puts 函 数 调 
// 显然 ， 这 里 将 会 输出 HELLO defined 
#if defined(HELLO) 


puts("HELLO defined!"); 
#endif 


// 这 里 判定 的 是 倘 大 定义 了 HELLO 这 ， 同 时 也 定义 了 HI 宏 ， 

// 地 淹 兴 面 的 putSs 函 数 j 

// 显然 ， 这 里 的 puts 范 数 不 会 被 编译 

#if defined(HELLO) && defined(HI) 
puts("Both defined" ) ， 

#endif 


| | 


// 这 里 定义 了 宏 HI， 并 将 该 宏 的 值 定义 为 2 
#define HI 2 


// 这 里 判定 的 是 倘若 定义 了 HELL0O 这 个 宏 ， 同 时 也 定义 了 HI 安 ， 

// 两 个 defined 表 达 式 的 值 加 起 守 HI 的 值 时 ， 则 纺 译 下 面 的 puts 画 数 调用 。 
// 显然 ,defined 表 达 式 的 值 均 为 1， 因为 这 两 个 宏 此 时 都 被 定义 。 
// 同时 ，HI 的 值 被 定义 为 了 2， 因 此 条 件 完全 满足 ， 下 面 的 printf 画 数 调用 将 被 编译 
#if defined(HELLO) && defined(HI) && (defined(HELLO) + defined(HI)) == HI 


// 这 里 输出 : HI value: 2 
printf("HI value: %d\n", HI); 


#endif 


int aa = 100; 


// 这 里 大 家 要 注意 ， 由 于 上 面 定义 的 aa 不 是 预 处 理 中 定义 的 宏 ， 因 此 在 预 处 理 中 找 不 到 该 标识 符 ， 
// 因此 这 里 由 于 找 不 到 aa 标 识 符 ，#if 条 件 不 成 立 ， 输 出 : aa is not defined! 


#if aa == 100 

puts("aa is defined!"); 
#else 

puts("aa is not defined!"),; 
#endif 


#define aa 20 


// 由 于 此 时 定义 了 aa 宏 ， 其 蔡 换 列表 的 整数 常量 
#if aa == 20 

puts("Yep!"); 
#endif 


// 这 里 将 输出 aa = 20， 因 为 aa 宏 定义 将 之 前 的 aa 对 象 标识 符 给 履 盖 掉 ] 
printf("aa = %d\n", aa); 


二 | 


长 达 式 确 实 为 20， 所 以 这 号 


让 
过 
me 


HYep! 


enum 
MY_ENUM1, 
MY_ENUM2, 
MY_ENUM3 
}; 


// 对 于 枚 举 符 而 言 ， 它 也 不 属于 预定 义 标 识 符 ， 因 此 下 面 将 输出 : MY_ENUM2 is not defined! 
#if MY_ENUM2 == 1 
puts("MY_ENUM2 is defined!"); 


#else 
puts("MY_ENUM2 is not defined!"),; 
#endif 
// 以 下 预 编译 语句 会 发 生 预 处 理 错误 ! 由 于 sizeof 操 作 符 只 能 用 于 C 代 码 的 编译 期 间 ， 
// 而 不 能 用 于 预 处 理 期 间 两 比 sizeof(int ) 是 一 个 非法 的 预 处 理 常 量 表达 式 
#if aa == sizeof(int) 
puts("Yep!"); 
#endif 


} 


除了 上 述 介绍 的 #f、#elif 与 #else 这 些 条 件 包 含 预 处 理 指 示 符 之 
外 ， 还 有 节 fdef 与 表 f 和 def 表 示 条 件 包含 的 预 处 理 指 示 符 。 划 fdef 类 似 于 
#if defined 的 简略 表达 方式 ， 不 过 ##fdef 后 面 只 能 跟 标 识 符 ( 即 宏 
名 ) ， 而 不 能 是 常量 表达 式 。 而 ##fndef 则 类 似 于 ##f! defined 的 简略 表 
达 方 式 ， 不 过 ##fndef 后 面 也 只 能 跟 标 识 符 ， 而 不 能 跟 常 量 表达 式 。 


代码 清单 10-8 将 利用 这 些 条 件 包含 预 处 理 与 10.2 节 中 列 出 的 C 语 言 
实现 可 选 预定 义 宏 相 结合 ， 给 出 当前 C 语 言 实现 与 运行 环境 所 提供 的 
情 慎 百 言 特 性 与 统 特 征 。 


代码 清单 10-8 条 件 包 含 预 处 理 与 C 语 言 实现 预定 义 安 


#include <stdio.h> 
int main(void) 


{ 
#ifdef __GNUC_ _ 

puts("GNU C or compatible compiler!"); 
#endif 


#ifdef _ clang 
puts("Current compiler is Clang!"); 
#endif 


#ifdef _MSC_VER 
puts("Current compiler is Microsoft Visual C!"); 
#endif 


#if defined(— i386 _) || defined( x86 64 ) 
puts("x86 processor!"); 

#elif defined(— arm__) | defined(_ arm64_ ) 
puts("ARM processor"); 

#endif 


#ifdef _ APPLE _ 
puts("Apple Inc. 0S"); 

#elif defined( WIN32) || defined(_wIN64) 
puts("Windows 0S") ， 

#endif 


#ifdef _ unix _ 
puts("Unix or compatible 0S"); 
#endif 


#ifdef _ linux _ 
puts("Linux or compatible 0S"); 
#endif 


#ifdef _ LP64 _ 
puts("long type is 64-bit!"); 
#endif 


// 相当 于 #if STDC_ANALYZABLE  != 0 
#if __STDC_ANALYZABLE _ 

puts("C Analyzability available!"),; 
#endif 


// 相当 于 #if __STDC_ISO_10646 I= 0 
#ifdef __STDC_ISO 10646 
printf("ISO 10646 %1d supported!i\n", STDC_ISO_10646 


#endif 


// 相当 于 #if STDC_UTF_ 16  != 0 
#if __STDC_UTF_16 
puts("UTF-16 supported!"); 


#endif 

#if STDC_UTF_32 != 0 
puts("UTF-32 supported!"); 

#endif 


#if STDC_IEC_559 == 
puts("ISO/IEC 559 comformed!"); 
#endif 


#if __STDC_NO_ATOMICS _ == 
puts("Atomics not available!"); 
#endif 


#if __STDC_NO_THREADS _ == 
puts("<threads.h> not available!"),; 
#endif 


} 


); 


10.4 ” 产 文 件 包含 预 处 理 指 示 符 


C 语 言 是 一 个 可 共享 的 编程 语言 ， 我 们 可 以 将 目 己 的 源 代码 编译 
成 库 ， 然 后 给 其 他 开发 人 员 使 用 。 这 样 ， 一 来 可 以 对 目 己 的 源 代 码 进 
行 保护 ， 因 为 库 中 的 代码 已 经 全 都 转 为 了 平台 相关 的 机 器 指令 码 ， 二 
来 也 不 影响 其 他 开发 者 对 库 中 的 函数 接口 进行 调用 。 那 么 我 们 如 何 将 
目 己 源码 中 的 对 外 函数 接口 以 及 数据 类 型 等 共享 给 其 他 开发 者 呢 ? 管 
案 殉 是 通过 头 文件 (header) | 


Sa 


C 语 言 中 的 头 文件 一 般 以 .h 作 为 后 缀 名 ， 而 且 C 语 言 编译 侨 一 般 不 
会 对 .h 文 件 进行 编译 ， 而 .h 头 文件 中 的 代码 如 采 存 在 语法 错误 ， 则 往往 
古 在 包含 进 源 文件 参与 编译 后 由 编译 絮 发 现 的 。 在 C 语 言 预 处 理 中 使 
用 ##include 预 处 理 指示 符 将 指定 的 文件 包含 到 当前 源 文件 中 。 


#include 有 两 种 形式 ， 一 种 是 : 


#include < 头 文件 名 > 换行 符 


还 有 一 种 是 : 


#include “ 头 文件 名 ” 换行 符 


第 一 种 使 用 <> 的 形式 会 使 得 预 处 理 器 将 <> 中 所 指定 文件 的 整个 内 
容 将 #include< 头 文件 名 > 这 整个 预 处 理 指 示 符 全 都 蔡 换 挥 。 其 中 ， 对 
<> 中 指定 的 文件 路 径 的 搜索 是 实现 目 定义 的 。 对 于 主流 蝎 面 系统 而 
言 ，<> 中 指定 的 文件 路 径 一 般 融 是 操作 系统 移 认 存放 库 头 文件 的 系统 
路 径 或 是 由 用 户 指定 的 系统 环境 路 径 。 


而 第 三 种 “» 的 方式 古 由 实现 先 通过 为 一 种 目 定义 的 搜索 方式 对 指 
定 文 件 进行 搜索 ， 如 果 搜 索 到 则 进行 内 容 蔡 换 ， 倘 大 搜索 不 到 ， 则 换 
用 <> 形 式 的 搜索 方式 进行 搜索 ， 如 果 再 搜索 不 到 ， 则 会 出 现 编译 出 
错 。 这 里 所 谓 的 “ 另 一 种 实现 目 定 义 搜索 方式 ”， 对 于 主流 时 面 系统 
司 通 常 束 十 当前 C 语 言 项 目 工程 下 的 路 径 。 


在 具体 实践 上 通常 来 说 ， 对 于 系统 目 融 头 文件 ， 包 括 C 语 言 标准 
库 的 头 文件 都 会 放置 在 每 个 操作 系统 的 指定 位 置 ， 我 们 可 以 直接 用 <> 
的 方式 ， 另 外 ， 我 们 通过 设置 当前 C 语 言 项 目 工 程 的 默认 头 文件 搜索 
路 径 ， 也 可 以 用 <> 的 形式 来 包含 指定 搜索 路 径 下 的 头 文件 ， 而 对 于 我 
们 自己 写 的 头 文件 ， 一 般 直 接 放 在 当前 C 语 言 工程 项 目 中 ， 我 们 可 采 
用 ”的 方式 包含 。 束 如 上 面 所 提 到 的 那样 ， 使 用 ”的 方式 包含 头 文 
件 ， 其 搜索 范围 比 用 <> 的 形式 来 得 广 。 


此 外 ，##nclude 后 面 可 以 跟 一 个 宏 名 ， 我 们 可 以 用 一 个 宏 对 象 来 指 
定 所 要 包含 的 文件 名 。 代 码 清 单 10-9 展 示 了 对 #include 预 处 理 指 示 符 的 
使 用 方法 与 作用 。 


代码 清单 10-9”#include 预 处 理 指示 符 的 使 用 与 效果 


/xx 以 下 是 自己 写 的 al.,h 头 文件 里 的 内 容 : */ 


// 这 里 使 用 条 件 预 编 译 是 为 了 防止 此 头 文件 被 某 一 源 文件 多 次 包含 
#ifndef ai_h 
#define ai_h 


#include <stdio.h> 
#define MY_MACRO 100 
struct MyStruct 
int a; 
float f; 
}; 
static void MyFunction(struct MyStruct s) 


printf("The value is: %f\n", s.a + S.f); 


#endif /* al_h */ 


/** 以 下 是 main.c 源 文件 内 容 */ 


// 由 于 al.h 中 已 经 包含 了 <stdio.h>， 因 此 这 里 可 以 不 用 包含 
#include "ali.h" 


Hl 


// 这 里 即便 再 次 包含 al1.h 也 没有 问题 ， 由 于 al.h 中 已 经 通过 条 件 预 编译 进行 了 重复 包含 的 保护 
#include "ali.h" 


int main(void) 
printf("The macro value is: %d\n", MY_MACRO); 
struct MyStruct s = { 10, 1.5f }; 


MyFunction(s); 


在 代码 清单 10-9 中 分 别 列 出 了 al.h 头 文件 与 main.c 源 文件 中 的 代 
码 。 在 main.c 源 文件 中 ， 使 用 了 ##include“al.h” 之 后 ， 其 实 是 将 整个 a1.h 
头 文件 中 的 内 容 全 都 包含 到 了 main.c 文 件 中 的 ##nclude“a1.h” 位 置 处 。 
因此 在 两 句 源 文件 包含 的 预 处 理 完成 之 后 ， 整 个 main.c 的 内 容 是 这 样 
的 : 


#define ai_h 
#include <stdio.h> 
#define MY_MACRO 100 
struct MyStruct 
int a; 
float f; 
}; 
static void MyFunction(struct MyStruct s) 


printf("The value is: %f\n", s.a + S.f); 


int main(void) 
printf("The macro value is: %d\n", MY_MACRO); 
struct MyStruct s = { 10, 1.5f }; 


MyFunction(s); 


我 们 看 到 ， 当 包含 了 al.h 头 文件 之 后 ， 在 main.c 源 文件 的 翻译 单元 
中 自动 就 定义 了 al_h 以 及 MY_MACRO 这 两 个 宏 。 在 main.c 中 ， 当 过 到 
第 2 条 好 nclude“al.h” 时 ， 由 于 al_h 宏 已 经 被 定义 ， 因 此 其 后 续 内 容 都 不 
会 被 再 次 包含 到 main.c 源 文件 中 。 


然后 我 们 再 看 代码 清单 10-10，#include 加 宏 名 的 使 用 场合 。 


代码 清单 10-10 ”在 ##incude 预 处 理 指示 符 后 跟 宏 名 


/** 以 下 是 自己 写 的 a1.h 头 文件 里 的 内 容 : */ 


// 这 里 使 用 条 件 预 编 译 是 为 了 防止 此 头 文件 被 某 一 源 文件 多 次 包含 
#ifndef ai_h 
#define ai_h 


#include <stdio.h> 

#define MY_MACRO 100 
struct MyStruct 

{ 


int a; 
float f; 


}; 
static void MyFunction(struct MyStruct s) 


printf("The value is: %f\n", s.a + S.f); 


#endif /* al_h */ 
/** 以 下 是 自己 写 的 a2 ,h 头 文件 里 的 内 容 : */ 
// 这 里 使 用 条 件 预 编 译 是 为 了 防止 此 头 文件 被 某 一 源 文件 多 次 包含 


#ifndef a2_h 
#define a2_h 


#define MY_MACRO -10 


struct MyStruct 


Short s; 
double d; 
}; 
static void MyFunction(struct MyStruct s) 
{ 
} 


#endif /* a2_h */ 


t 


/** 以 下 是 main,c 源 文件 


中 的 内 容 */ 


#include <stdio.h> 


// 这 里 先 定义 一 个 USE_A2_HEADER 安 
#define USE_A2_HEADER 


// 以 下 条 件 预 编 译 判 别 的 是 : 如 果 定 义 了 USE_A2_HEADER 安 ， 
// 那么 将 HEADER_NAME 定 义 为 "a2.h"; 否则， 将 HEADER_NAME 定 义 为 "al.hy" 
#ifdef USE_A2_HEADER 


#define HEADER_NAME "a2.h" 
#else 
#define HEADER_NAME "ali.h" 
#endif 


// 这 里 通过 HEADER_NAME 所 定义 的 头 文件 名 进行 包含 
// 当前 包含 的 是 "a2 .hy" 
#include HEADER_NAME 


int main(void) 

{ 
printf("The macro value is: %d\n", MY_MACRO); 
struct MyStruct s = { 10, 1.5f }; 


MyFunction(s); 


在 main.c 中 ， 一 开始 定义 了 宏 USE_A2 _ HEADER， 因 此 
HEADER_NAME 安 所 指定 的 是 “a2.h”， 如 果 我 们 把 #define 
USE_A2_HEADER 注 释 掉 ， 那 么 包含 的 将 是 “al.h”。 


10.5 ”#error 预 处 理 指示 符 


#error 预 处 理 指 示 符 用 于 在 预 处 理 过 程 中 报 出 指定 的 错误 诊断 信 
忆 。 其 形式 为 


#error ， 预 处 理 符号 可 选 。 ”换行 符 


如 果 源 文件 中 含有 #error 预 处 理 指示 符 ， 并 且 它 发 生 作 用 ， 那 么 编 
译 老 就 会 报 #error 后 面 指定 预 处 理 符 号 信息 字样 的 错误 。 如 代码 清单 
10-11 所 示 。 


代码 清单 10-11 ” #error 预 处 理 指示 符 


// #define MY_SAFE_ MACRO 


#ifndef MY_SAFE_MACRO 

// 如 果 MY_SAFE_MACR0O 没 有 被 定义 ， 那 么 这 里 就 会 报错 ， 显 示 : safe macro not defined! 
#error Safe macro not defined! 

#endif 


// 这 里 直接 报错 ， 但 不 输出 错误 信息 
#error 


int main(void) 


} 


代码 清单 10-11 中 ， 先 把 MY_SAFE_MACRO 宏 定义 给 屏蔽 掉 ， 所 
以 在 编译 整个 源 代码 时 会 报错 误 信 息 。 一 般 #error 与 条 件 预 编译 一 起 使 
用 的 场合 较 多 。 


此 外 ， 有 些 编译 絮 还 支持 #warning， 其 用 法 与 #error 一 样 ， 只 不 过 
编译 器 输出 的 是 警告 信息 ， 而 不 阻碍 编译 絮 继 续 编 译 。 


10.6 ”要 ine 预 处 理 指示 符 


##ine 预 处 理 指 示 符 用 于 作为 行 号 控制 。 其 形式 为 : 


#1ine ”数字 序列 换行 符 


看 ine 后 面 的 数字 即 指定 它 下 一 行 的 行 号 。 使 用 圾 ine 预 处 理 指示 
符 ， 预 处 理 需 在 计算 行 号 时 吏 以 它 作为 基准 开始 算 ， 而 忽略 在 该 预 处 


理 指示 符 之 前 的 行 号 状态 。 


此 外 ， 夫 ine 还 有 一 种 形式 可 用 来 修改 当前 的 源 文件 名 : 


#1ine ”数字 序列 “ 源 文件 名 ” 换行 符 


这 样 ， 除 了 当前 行 号 ， 连 源 文件 名 部 能 一 起 被 修改 。 代 码 清单 10- 
12 展 示 了 圾 ine 预 处 理 指示 符 的 使 用 方式 以 及 效果 。 


代码 清单 10-12 ” 吉 ine 预 处 理 指示 符 的 使 用 与 效果 


#include <stdio.h> 


int main(void) 


#line 10 
printf("The current line is: %d\n", LINE  ); 
// 上 面 输出 : The current line is: 10 
printf("The current line is: %d\n"，__LINE _); // 这 里 输出 13 


#1line 100 "hello.cc" 
printf("The current line: %d, and file name: %s\n", __LINE , 
__FILE  ); 


// 上 面 输出 : The _ current line: 100, and file name: hello.cc 


10.7 #undef 预 处 理 指示 符 


#undef 预 处 理 指 示 符 用 于 取消 之 前 定义 过 的 宏 。 其 形式 为 : 


#undef 标识 符 换行 符 


这 里 的 标识 符 束 表示 一 个 宏 名 。 如 末 #undef 后 面 的 宏 名 之 前 没 被 
定义 过 也 没关系 ， 预 处 理 眉 不 会 报错 。 如 采 #undef 后 面 的 宏 名 之 前 修 
定义 过 ， 那 么 之 前 定义 的 宏 束 被 撤销 。 代 码 消 单 10-13 展 示 了 #undef 的 
使 用 与 效果 。 


代码 清单 10-13”#undef 的 使 用 与 效果 


#include <stdio.h> 


#define MY_MACRO 100 


// 这 里 使 用 #undef 将 MY_MACR0O 宏 取消 定义 
#undef MY_MACRO 


// 随后 这 里 再 重新 定义 MY_MACRO 宏 
#define MY_MACRO 200 


int main(void) 


// 这 里 将 会 输出 200 
printf("MY_MACRO value is: %d\n", MY_MACRO); 


// 即便 没有 定义 过 YOUR_MACRO0 宏 ， 放 在 #undef 后 也 没 问 题 
#undef YOUR_MACRO 


// 再 次 取消 定义 MY_MACRO 
#undef MY_MACRO 


#ifndef MY_MACRO 

// 这 里 编译 器 会 报警 : MY_MACRO not defined! 
#warning MY_MACRO not defined! 

#endif 


} 


代码 清单 10-13 演 示 了 #undef 的 使 用 ， 通 过 这 段 代 码 我 们 可 以 清晰 
地 了 解 到 #undef 将 一 个 指定 宏 给 取消 定义 的 效果 。 这 里 大 家 要 注意 的 
症 ， 对 于 一 个 宏 ， 只 有 当 它 被 取消 定义 之 后 才能 给 它 重新 定义 一 个 蔡 
换 列表 。 


10.8。 pragma 预 编 译 指 示 符 与 操作 符 


#pragma 预 处 理 指示 符 用 于 指示 当前 翻译 单元 使 用 某 种 编译 特性 进 
行 编译 。 比 如 ， 可 以 指定 哪些 函数 用 某 个 优化 选项 进行 优化 ， 从 哪里 
开始 使 用 标准 浮 点 约定 等 。 其 形式 为 : 


#pragma ” 预 处 理 符 号 。 换行 符 


这 里 ， 预 处 理 符号 束 古 pragma 指 定 的 编译 选项 ， 这 些 编 译 移 项 一 
般 由 编译 右 实 现 目 己 定义 。 当 然 ，C 语 言 标准 也 列 出 了 才干 标准 的 编 
译 选项 ， 以 STDC 作 为 前 经， 其 形式 为 : 


#pragma STDC 标准 支持 的 编译 选项 关 值 ”换行 符 


这 里 ， 开 关 值 有 三 种 ， 分 别 是 : ON、OFF 与 DEFAULT 。 


除了 #pragma 预 处 理 指 示 符 外 ，C 语 言 标准 从 C99 开 始 引 入 了 


_Pragma 探 作 符 。 


_Pragma 操 作 符 的 语义 与 #pragma 预 处 理 指示 符 一 样 ， 只 不 过 它 更 
为 灵活 ， 可 用 于 宏 定 义 的 替换 列表 中 ， 而 #pragma 预 处 理 指示 符 则 不 
能 。_Pragma 操 作 符 的 形式 为 : 


CN EH re 时 ) 


_Pragma ( 子 付 串 子 面 号 


它 后 面 可 以 直接 跟 函 数 、 结 构 体 类 型 等 元 素 的 定义 。 代 码 清单 10- 
14 介 绍 了 #pragma 预 处 理 指示 符 与 _Pragma 操 作 符 的 使 用 。 


代码 清单 10-14 加 ragma 预 处 理 指示 符 与 _Pragma 操 作 符 的 使 用 


#include <stdio.h> AS 
// 这 里 使 用 #pragma 预 处 理 指 示 符 开启 遵循 浮 点 数 标准 的 编译 选项 
#pragma STDC FP_CONTRACT ON 


// 指示 后 面 的 代码 用 -02 优 化 选项 进行 优化 
#pragma 02 


static void MyFunc(int a) 


a += 100 
printf( "a = %d\n", a); 


译 


// 指示 后 面 的 代码 用 -00 优 化 选项 纺 
#pragma 00 


// 这 里 根据 当前 编译 器 是 否 预定 义 了 DEBUG 宏 来 指示 MY_PRAGMA_0PTION 宏 的 状态 。 
// 如 果 预 定义 了 DEBUG 宏 ， 那 么 MY_PRAGMA_O0PTION 宏 用 -00 的 编译 选项 ; 

// 否则 使 用 -02 的 编译 选项 

#ifdef DEBUG 

#define MY_PRAGMA_OPTION _Pragma("00") 

#else 

#define MY_PRAGMA_OPTION _Pragma("02") 

#endif 


ee 


MY_PRAGMA_OPTION 
static int MyFunc2(int a, int b) 


return a*a+b™* pb， 


j 圣 


// 指示 从 main 画 数 开始 的 代码 用 -01 优 化 选项 编 
_Pragma("01") int main(void) 


也 


MyFunc(10) 


int Value = MyFunc2(3, 4); 
printf("The value is: %d\n", value); 


通过 代码 清单 10-14， 我 们 可 以 看 到 利用 Comte 
作 符 的 结合 使 用 能 非常 方便 地 通过 当前 环境 上 下 文 来 指定 目 己 需要 的 


10.9 到 指示 符 与 C 语 言 中 的 程序 注释 


预 处 理 指示 符 中 的 空 指示 符 比 较 简 单 ， 形 式 为 : 


# 换行 符 


# 与 换行 符 之 间 可 以 存在 空 日 符 。 它 在 实际 代码 中 没有 任何 效 采 。 
有 了 时 在 写 一 连 串 预 处 理 指示 和 从 时 ， 添 加 一 些 空 指示 符 可 能 会 使 得 代码 
格式 更 好 看 一 些 。 代 码 清单 10-15 展 示 了 空 指示 符 的 一 般 使 用 。 


代码 清单 10-15” 空 指示 符 的 使 用 


#include <stdio.h> 
# 


#ifdef HELLO 

#warning HELLO is defined 
#endif 

# 

#define HELLO 100 

# 


int main(void) 


printf("HELLO = %d\n", HELLO); 


下 面 主要 谈论 C 语 言 的 注释 。 对 于 程序 代码 来 说 ， 注 释 的 重要 性 
不 言 而 喻 ， 无 论 是 给 目 己 的 编程 思路 留 个 注解 还 是 给 其 他 人 看 源码 ， 
这 些 一 般 都 需要 注释 加 以 辅助 。 我 们 之 前 的 所 有 代码 示例 中 几乎 都 合 
有 注释 ， 用 于 说 明 当前 语句 的 作用 以 及 效果 。 在 计算 机 编程 语言 中 ， 
注释 (comment) 是 不 参与 编译 的 ， 而 只 是 作为 描述 性 的 文字 片段 。 


注释 可 以 用 来 描述 当前 源 代 码 主要 实现 什么 功能 ， 摘 述 函 数 实现 什么 
功能 ， 结 构 体 、 联 合体 等 用 户 目 定 义 类 型 表示 什么 含义 等 。 


在 C11 标 准 中 ， 注 释 有 两 种 形式 ， 第 一 种 是 行 注释 ， 在 一 行 代 码 
中 只 要 不 古 出 现在 “或 ?内 的 // 符 号 ， 一 直到 这 一 行 的 换行 符 ， 都 属于 
注释 部 分 。 从 下 一 行 开始 则 不 属于 注释 部 分 ， 而 是 正式 的 代码 部 分 。 
男 一 种 是 语句 块 注释 ， 从 出 现 不 包含 在 * 或 “内 的 /* 符 号 开始 一 直到 */ 
结束 都 属于 注释 部 分 。/* 到 */ 之 间 可 以 存在 多 个 换行 符 。 


在 C 语 言 中 ， 如 果 出 现 注 释 ， 那 么 C 语 言 实现 在 预 处 理 阶 段 就 会 去 
掉 它 所 遇 到 的 注释 行 和 注释 段 ， 一 般 会 用 一 个 空白 符 来 代 苦 ， 不 过 C 
语言 标准 也 没有 具体 指定 用 什么 符号 去 替换 整个 注释 行 与 注释 段 ， 但 
征 对 于 C 语 言 程序 员 来 说 ， 需 要 将 注释 看 作 代 码 中 的 一 个 空 日 符 。 代 
码 清单 10-16 展 示 了 注释 的 一 些 用 法 以 及 效果 。 


代码 清单 10-16 ”注释 的 使 用 与 效果 


#include <stdio.h> 
#include <stdbool.h> 
/* 这 是 一 个 注释 段 ， 

可 以 用 来 大 篇 幅 地 介 乡 
*/ 


nd 


当前 源 文件 、 画 数 等 功能 描述 。 


#define MY_LITERAL(expr) #expr 


int main(void)  // 这 是 一 个 注释 行 ， 可 以 用 来 描述 某 句 代码 表示 什么 含义 
{ 


const char *s = "// 这 不 是 一 个 注释 ， 而 是 一 个 字符 串 " 
printf("s = %s，%c\n"，s，'// '); // '//' 也 不 是 一 个 注释 ， 而 是 一 个 字符 常量 


int var = 100; 


// 下 面 这 句 是 错误 的 ， 这 里 并 不 是 var += 100， 而 是 被 看 作为 V ar += 100 
#if false 
V/* 这 里 用 注释 隔断 */ar += 100; 


#endif 


s = MY_LITERAL(you/* 这 里 用 注释 隔断 */win ) ; 


// 这 里 将 输出 : you win。 这 两 个 单词 中 间 用 一 个 空格 隔断 。 
printf("var = %d, s = %s\n", var, Ss); 


// 如 果 在 一 个 行 注释 中 出 现 /*， 那 么 它 已 经 被 融 为 当前 行 注释 中 的 内 容 ， 
// 而 不 起 到 注释 段 开头 的 作用 。 所 以 后 面 再 用 */ 是 无 效 的 本 
/* 同样 ， 如 果 在 注释 段 中 出 现 //， 那 么 它 也 被 融 为 注释 内 容 的 一 部 分 ， 也 不 再 充当 注释 行 的 开头 


代码 清单 10-16 展 示 了 比 以 往 更 多 形式 的 注释 ， 以 及 注释 在 代码 中 
扮演 的 作用 。 我 们 在 代码 清单 10-16 中 可 以 清楚 地 看 到 ， 注 释 段 被 
Clang 编 译作 在 预 处 理 时 转 为 了 一 个 空格 符 。 


10.10 ”本章 小 结 


本 章 介绍 了 C 语 言 预 处 理 大 的 所 有 特性 ， 展 示 了 C 语 言 强大 的 安 功 
能 以 及 条 件 预 编 译 等 高 效 、 灵 活 的 特性 。 通 过 将 安 、 条 件 预 编 译 、 
pragma 等 组 合 使 用 ， 可 使 得 C 语 言 代码 更 具 跨 平台 性 、 可 移植 性 以 及 
紧凑 性 。 当 然 ， 对 宏 的 滥用 也 可 能 导致 程 序 调试 的 不 便捷 ， 所 以 设计 


安 的 时 候 需 要 小 心 齐 慎 。 


此 外 ， 本 章 对 C 语 言 的 注释 做 了 进一步 详细 介绍 ， 描 述 了 注释 的 
作用 以 及 在 代码 中 的 使 用 效果 。 通 过 本 章 的 学 习 ， 大 家 可 以 写 出 更 丰 
富 、 更 “专业 ”的 C 语 言 程序 代码 。 


第 11 革 Ci 语言 程序 的 编译 上 下 文 


本 章 将 为 大 家 介绍 C 语 言 中 的 编译 上 下 文 相 关 话 题 。 其 中 包括 对 
象 、 函 数 以 及 类 型 标识 符 的 作用 域 和 名 字 空 间 ， 对 象 与 国 数 的 连接 以 
及 对 象 的 生命 周期 。 由 于 在 编程 语言 中 ， 对 数据 对 象 的 管理 、 函 数 接 
口 的 抽象 化 在 维护 较 大 项 目 工 程 的 时 候 会 显得 非常 重要 ， 因 此 通过 学 
习 本 章 ， 我 们 可 以 将 目 己 写 的 C 语 言 程序 中 的 函数 、 对 象 、 类 型 进行 
更 好 地 安排 使 得 我 们 的 程序 或 库 有 着 更 加 民 好 的 封装 性 ， 同 时 也 能 
使 代码 写 得 更 安全 、 健 壮 。 


11.1 C 语 言 程序 中 的 作用 域 和 名 字 空 间 


C 语 言 程序 中 ， 一 个 标识 符 (identifier) 可 用 来 表示 一 个 对 象 ， 函 
数 ， 结 构 体 、 联 合体 以 及 枚 举 的 名 称 或 是 它们 的 成 员 〈 枚 举 的 成 员 又 
被 称 为 枚 举 常 量 ) ，typedef 名 (13.4 节 将 会 详细 描述 ) ， 跳 转 标 签 
名 ， 宏 名 ， 或 是 一 个 宏 形 参 。 同 一 个 标识 符 在 程序 中 的 不 同位 置 可 能 
会 表示 不 同 的 实体 ， 也 就 是 说 在 C 语 言 中 ， 标 识 符 允 许 被 覆盖 。 


对 于 一 个 标识 符 所 指 代 的 每 个 不 同 的 实体 ， 只 有 在 一 个 程序 文本 
的 区 域内 ， 该 标识 符 才 是 “可 见 的 *， 这 个 区 域 就 被 称 为 作用 域 
(scope) 。 如 果 某 个 标识 符 同时 指 代 了 多 个 不 同 的 实体 ， 那 么 这 些 实 
体 要 么 具有 不 同 的 作用 域 ， 要 么 在 不 同 的 名 字 空 间 中 。C 语 言 一 共有 4 
种 作用 域 ， 分 别 是 ， 画 数 作用 域 、 文 件 作 用 域 、 语 句 块 作用 域 以 及 画 
数 原型 作用 域 。 下 面 ， 我 们 将 分 别 介绍 这 4 种 作用 域 。 


11.1.1 文件 作用 域 


在 C 语 言 标准 中 ， 对 具有 文件 作用 域 的 标识 符 的 定义 非常 有 意 
思 , 用 的 是 排除 法 一 一 如 果 一 个 标识 符 声 明 在 所 有 语句 块 之 外 ， 同 时 
也 在 形 参 列 表 之 外 ， 那 么 我 们 称 该 标识 符 具 有 文件 作用 域 。 文 件 作 用 
域 从 当前 源 文 件 开始 一 直到 源 文件 末尾 结 


这 里 有 几 个 非常 典型 的 例子 。 如 果 读 者 学 过 Java、Cr++ 等 面 癌 对 
象 的 编程 语言 ， 那 么 应 该 知道 这 些 编 程 语言 中 的 类 可 以 代 套 定义 类 ， 
并 且 藤 套 类 的 作用 域 属于 其 外 部 类 。C 语 言 也 能 在 结构 体 或 联合 体 中 
馈 套 定义 结构 体 或 联合 体 ， 但 敬 套 定义 的 结构 体 和 联合 体 具 有 与 其 外 
部 结构 体 或 联合 体 同等 的 作用 域 。 也 整 是 说 ， 如 末 定 义 的 外 部 结构 体 
在 文件 作用 域 中 ， 那 么 其 内 部 藤 套 定义 的 结构 体 也 处 于 文件 作用 域 
中 。 同 样 ， 定义 在 文件 作用 域 的 枚 举 类 型 中 的 枚 举 肖 量 也 具有 文件 作 
用 域 。 在 C 语 言 中 ， 结 构 体 、 联 合体 与 榴 举 定义 块 本 映 不 具有 “作用 
域 ” 属 性 ， 它 们 不 属于 语句 块 。 


此 外 ， 对 于 预 处 理 右 中 的 宏 、 条 件 预 编译 等 指示 符 ， 
有 文件 作用 域 ， 而 不 受 其 他 作用 域 的 影响 (参见 第 10 革 的 介绍 ) 。 代 
码 清单 11-1 展 示 了 共有 文件 作用 域 的 标识 符 。 


代码 清单 11-1 具有 文件 作用 域 的 标识 符 


#include <stdio.h> 


// 这 里 OutStruct 结 构 体 类 型 处 于 文件 作用 域 
struct OutStruct 


// a 是 0utStruct 结 构 体 的 成 员 对 象 ， 不 具有 作用 域 属性 
7 


// InnerStruct 是 定义 在 OutStruct 内 部 的 结构 体 ， 但 具有 文件 作用 域 
struct InnerStruct 


int 工 ; 
} inner; // 这 里 inner 作 为 0utStruct 结 构 体 的 成 员 对 象 
// 在 0utStruct 结 构 体 内 定义 的 枚 举 类 型 也 具有 文件 作用 域 


enum MY_ENUM 


枚 举 常量 也 同样 具有 文件 作用 域 


// 这 里 面 的 
MY_ENUM_ 1, 
MY_ENUM_2 


} 8; 
}; 


// 这 里 对 象 sa 处 于 文件 作用 域 ， 

// 另外 我 们 可 以 看 到 定义 在 OutStruct 结 构 体 内 部 的 InnerStruct 可 以 直接 被 访问 ， 
// 也 就 是 说 InnerStruct 是 全 局 可 见 的， 因此 它 具 有 文件 作用 域 

static int sa = sizeof(struct Innerstruct); 


// MyTest 范 数 具 有 文件 作用 域 
static void MyTest(void) 


{ 
// 尽管 宏 MY_MACRO 定 义 在 MyTest 函 数 内 ， 但 它 仍然 具有 文件 作用 域 ， 不 受 函 数 语句 块 的 影响 
#define MY_MACRO 100 


// main 函 数 处 于 文件 作用 域 
int main(void) 


struct OutStruct out = { 10, { 100 }, MY_ENUM 2 }; 


// 这 里 可 直接 访 问 InnerStruct 结 构 体 类 型 
struct InnerStruct inner = { 20 }; 


// 这 里 也 可 以 直接 访问 宏 MY_MACRO 
printf("The value is: %d\n", out.a + out.inner.i + inner.i + sa - 
MY_MACRO); 


代码 清单 11-1 中 我 们 可 以 清晰 地 看 到 ， 在 具有 文件 作用 域 的 结构 
体内 再 定义 一 个 结构 体 ， 其 内 部 结构 体 也 具有 文件 作用 域 。 所 以 ,为 
了 避免 全 局 名 字 空 间 的 污染 ， 我 们 在 编写 C 语 言 程 序 时 应 当 尽量 避免 
在 文件 作用 域 中 定义 的 结构 体 、 联 合体 内 定义 命名 结构 体 或 联合 体 ， 
取而代之 的 是 ， 可 以 用 匿名 结构 体 或 联合 体 。 


此 外 ， 代 码 清 单 11-1 中 我 们 还 看 到 了 宏 不 受 其 他 作用 域 的 影响 ， 
始终 剑 持 厦 文 件 作 用 域 的 特性 ， 这 也 是 预 处 理 指 示 符 的 特性 


11.1.2” 画 数 作用 域 


C 语 言 标 准 明确 规定 ， 跳 转 标 签名 是 仅 有 的 具有 函数 作用 域 的 标 
识 符 。 男 数 作用 域 从 一 个 函数 体 的 开始 ( 即 紧 跟 在 {符号 的 后 面 ， 一 
直到 函数 体 结束 ( 即 紧 跟 在 } 符 号 前 面 ) 。 跳 转 标签 可 以 出 现在 函数 体 
中 的 任何 位 置 ， 在 使 用 时 ， 随 着 goto 语 句 一 起 出 现 。 


代码 清单 11-2 将 简单 朱 述 仅 有 的 作为 画 数 作 用 域 标 识 符 的 跳 转 标 


代码 清单 11-2 具有 函数 作用 域 的 标识 符 ( 跳 转 标签 ) 


#include <stdio.h> 
int main(void) 


int count = 5; 
// 这 里 声明 了 一 个 HELLO_LABEL 跳 转 标 签 ， 它 具有 画 数 作用 域 
HELLO_LABEL : 
puts("Hello, world!"); 
if(--count > 0) 
goto HELLO_LABEL;  // 跳 转 到 HELLO_LABEL 标 签 处 
switch(count) 


有 尽管 在 switch 语 句 块 内 声明 SWITCH_INNER_LABEL 跳 转 标 签 
// 但 它 仍 然 属于 函数 作用 域 
SWITCH_INNER_LABEL: 
printf("count = %d\n", count); 
break; 
default: 
break; 


if(--count > 0) 
goto SWITCH_INNER_LABEL ; // 跳 转 到 HELLO_LABEL 标 签 处 


代码 清单 11-2 可 以 清晰 地 看 到 ， 跳 转 标 签 始终 具有 函数 作用 域 ， 
而 不 受 其 他 语句 块 作用 域 的 影响 。 这 也 是 为 什么 C 语 言 标准 将 跳 转 标 
签 专门 独立 出 一 个 函数 作用 域 的 原因 。 


11.1.3 ”函数 原型 作用 域 


C 语 言 标准 指出 ， 如 果 一 个 标识 符 是 声明 在 一 个 函数 原型 (该 芳 
数 原型 不 作为 函数 定义 的 一 部 分 ) 中 的 形 参 列表 内 ， 那 么 该 标识 符 则 
具有 函数 原型 作用 域 。 函 数 原 型 作用 域 从 形 参 列表 的 ″ 开始 ， 到 画 
数 声明 符 的 末尾 结束 。 


不 过 当前 主流 编译 怖 中 ， 普 志 不 满足 函数 原型 作用 域 到 函数 声明 
符 的 末尾 结束 ， 而 一 般 是 将 作用 域 范围 缩短 到 了 形 参 列 表 中 紧 跟 ) 符 
号 之 前 。 所 以 我 们 在 利用 函数 原型 作用 域 中 的 标识 符 的 时 候 需 要 注意 
实现 上 的 差异 性 。 代 码 清 单 11-3 展 示 了 函数 原型 作用 域 的 概念 


代码 清单 11-3” 配 数 原型 作用 域 


AR 


/** 这 里 ， 形 参 标识 符 a 以 及 形 参 标识 符 pArray 都 具有 画 数 原型 作用 域 。 
* 我 们 可 以 看 到 ， 在 声明 pArray 形 参 的 时 候 还 用 到 ] 参 a 的 标识 符 ， 
* 说 明 形 参 a 标 识 符 在 此 形 参 列表 中 可 见 。 
* 在 Clang 编 译 器 中 ， 如 果 我 们 把 [sizeof (int)] 中 的 int 改 为 a， 

* 那么 编译 器 就 会 报错 ， 标 识 符 'a' 没 有 声明 
*/ 
static int (*Foo(int a, int (*pArray)[sizeof(a)]))[sizeof(int)]; 


每 


这 里 补充 说 明 一 下 ， 代 码 清单 11-3 中 ， 函 数 Foo 被 声明 为 具有 int 
(*) [sizeof (int) ] 指 向 数组 的 指针 返回 类 型 ， 融 有 int 类 型 的 形 参 a 以 
及 带 有 int (*) [sizeof (a) ] 指 向 数组 的 指针 类 型 的 形 参 pArray。 


11.1.4 语句 块 作用 域 


C 语 言 标准 指出 ， 如 采 一 个 标识 符 的 声明 出 现在 一 个 语句 块 内 ， 
或 是 出 现在 一 个 函数 定义 中 的 形 参 声明 列表 中 ， 那 么 该 标识 符 具 有 语 
句 块 作用 域 。 语 句 块 作用 域 是 从 当前 语句 块 的 {开始 一 直到 } 结 束 。 


这 里 要 注意 的 是 ， 之 前 也 提 到 过 ， 结 构 体 、 联 合体 、 枚 举 类 型 定 
义 时 的 花 括号 不 算 语句 块 ， 它 们 均 属于 类 型 说 明 符 (type specifier) 的 
一 部 分 。 在 结构 体 与 联合 体 中 ， 花 括号 内 的 数据 对 象 属 于 该 结构 体 或 
联合 体 的 成 员 ， 数 据 对 象 成 员 不 具有 “作用 域 ” 这 个 属性 ， 如 果 是 内 概 
定义 命名 结构 体 或 联合 体 ， 那 么 内 藤 的 结构 体 或 联合 体 的 作用 域 与 其 
外 部 结构 体 或 联合 体 的 作用 域 一样 。 枚 举 类 型 中 的 枚 举 利 量 ， 其 作用 
域 与 枚 举 类 型 一 样 。 代 码 清单 11-4 展 示 了 语句 块 作用 域 以 及 上 述 提 到 


的 一 些 注意 事项 。 


代码 清单 11-4 语句 块 作用 域 的 朱 述 


#include <stdio.h> 


// MyStruct 结 构 体 具有 文件 作用 域 
struct MyStruct 


int a; 
// 下 面 这 个 数组 对 象 声 明 会 引发 错误 ， 由 于 成 员 a 不 作为 任何 作用 域 ， 
// 因此 在 声明 结构 体 成 员 对 象 的 时 候 无 法 被 引 

int b[sizeof(a)]; 


// InnerStruct 结 构 体 同样 具有 文件 作用 域 
struct InnerStruct 


五 


int 1i; 
} inner ， 


// 由 于 InnerStruct 具 有 文件 作用 域 ， 
// 因此 它 可 以 在 对 象 成 员 声 明 中 被 引用 ， 而 inner 对 象 则 不 行 
int c[sizeof(struct InnerStruct )]， 


】 


// MyEnum 具 有 文件 作用 域 
enum MyEnum 


{ 
// MyEnum1 与 MyEnum2 两 个 枚 举 常 量 都 具有 文件 作用 域 
MyEnum1 = 1, 
MyEnum2， 
// 由 于 MyEnum1 与 MyEnum2 两 个 枚 举 常量 都 具有 文件 作用 域 ， 
// 所 以 它们 可 以 在 声明 后 续 枚 举 常 量 中 被 引用 
MyEnum3 = MyEnum1 + MyEnum2 
}; 
/xx 这 里 的 函数 Foo 具 有 文件 作用 域 ， 于 它 是 一 个 函数 定义 ， 
* 所 以 形 参 对 象 a 以 及 arr 具 有 语句 块 作 用 域 ， 第 二 个 形 参 arr 则 直接 引用 了 标识 符 a。 
* 不 过 在 Clang 实 现 中 ，a 仍 然 不 能 在 ( ) 形 参 列表 外 可 见 ， 但 可 以 在 函数 体内 可 见 。 


* 因此 ， 这 里 sizeof (int ) 中 的 int 改 为 a 就 会 编译 报错 。 
* 这 里 Foo 画 数 的 返回 类 型 为 int (*)[sizeof(int)] 


yh 
static int (*Foo(int a, int arr[sizeof(a)]))[sizeof(int)] 
{ 
// 由 于 形 参 对 象 a 具 有 语句 块 作用 域 ， 因 此 在 函数 体内 完全 可 以 被 访问 
printf("a = %d\n", a); 
// 由 于 形 参 a 已 经 在 Foo 郴 数 的 语句 块 作用 域 ， 因 此 这 里 不 能 再 以 标识 符 a 来 声明 一 个 对 象 
// int a = 10; 
// 由 于 在 范 数 体内 ，Foo 画 数 已 经 具有 完整 的 函数 原型 ， 因 此 可 以 在 语句 块 作用 域内 被 引 


prIntt ns ze of return type is: %zu\n", sizeof(Foo(©0, NULL)[0])); 


return NULL; 


int main(void) 


// 这 里 My0bject 结 构 体 类 型 具有 语句 块 作用 域 
struct MyObject 


Ce 
int a,; 
// 这 里 Inn 结 构 体 也 同样 具有 语句 块 作用 域 
struct Inn 
{ 
int n,; 
} inn; 
}; 


// 枚 举 类 型 TheEnum 具 有 语句 块 作用 域 
enum TheEnum 


// 下 面 的 TheEnum1 与 TheEnum2 枚 举 常量 都 具有 语句 块 作用 域 
TheEnum1, 


TheEnum2 


世 


}; 


// 引用 文件 作用 域 的 MyStruct 与 InnerStruct 
struct MyStruct ms = { 10, (struct InnerStruct){t 20 } }; 


NE 


// 引用 文件 作用 域 的 MyEnum 
enum MyEnum en = MyEnum2; 


// 引用 语句 块 作用 域 的 My0bject 与 Inn 
struct MyObject obj = { 30, (struct Inn){ 40 } }; 


// 引用 语句 块 作用 域 的 TheEnum 
enum TheEnum te = TheEnumi1; 


// 调用 文件 作用 域 的 Foo 画 数 
Foo(ms.a + ms.inner.i + en + obj.a + obj.inn.n + te, NULL); 


} 
void foo(void) 


struct MyObject obj; // 错误 ，My0bject 无 法 被 访问 
enum TheEnum en = TheEnum1; // 错误 ，TheEnum 与 TheEnum1 无 法 被 访问 


// 引用 文件 作用 域 的 MyStruct 与 Innerstruct, OK 
Struct MyStruct ms = { 10, (struct InnerSstruct){ 20 } }; 


// 引用 文件 作用 域 的 MyEnum，OK 
enum MyEnum en = MyEnum2; 


代码 清单 11-4 比 较 详 细 地 展示 了 语句 块 作用 域 的 特点 以 及 它 与 文 
件 作 用 域 和 画 数 原型 作用 域 的 差异 性 。 


由 于 之 前 提 到 ， 在 一 个 源 代码 上 下 文中 ， 同 一 标识 符 在 不 同位 置 
可 指 代 多 个 不 同 实体 ， 因 此 在 C 语 言 中 ， 不 同 作用 域 的 相同 标识 符 是 
可 被 重 定 义 的 ， 下 面 我 们 将 介绍 C 语 言 中 标识 符 的 重 定义 以 及 作用 域 


的 看 交 。 
11.1.5 “标识 符 的 重 定义 与 作用 域 的 县 交 


C 语 言 标 准 明确 指出 ， 同 一 标识 符 在 程序 中 的 不 同位 置 可 以 指 代 
不 同 实体 。 此 外 ， 在 同一 名 子 空间 中 ， 如 采 一 个 标识 符 指 代 了 两 个 不 
同 的 实体 ， 那 么 作用 域 可 能 什 交 。 如 末 在 同一 名 字 空 间 中 有 相互 合 交 
的 作用 域 ， 那 么 内 部 作用 域 必须 在 外 部 作用 域 之 前 结束 ， 也 融 是 说 ， 


内 部 作用 域 的 范围 是 外 部 作用 域 的 真子 集 。 如 采 一 个 标识 符 分 别 在 外 
部 作用 域 和 内 部 作用 域 声 明了 两 个 不 同 的 实体 ， 那 么 在 内 部 作用 域 
中 ， 用 此 标识 符 所 声明 的 实体 将 会 履 盖 掉 〈 即 隐藏 掉 ) 外 部 作用 域 声 
明 的 实体 。 


代码 清单 11-5 介 绍 了 标识 从 的 重 定义 与 作用 域 的 合 交 的 作用 与 效 
i 


代码 清单 11-5 ”标识 符 的 重 定义 与 作用 域 的 县 区 的 作用 与 效果 


#include <stdio.h> 
#include <stdint.h> 


// 在 文件 作用 域 声明 一 个 整 型 对 象 sa 


static int sa = 10; 


// 在 文件 作用 域 定义 了 一 个 结构 体 类 型 MyTest 
struct MyTest 


int a; 
float f; 


}; 


人 

* 在 文件 作 城 声 明了 一 个 各 为 Foo 的 加 数 ， 
* 其 中 该 函数 的 形 参 具有 函数 原型 作用 域 有 的 形 参 sa 覆盖 掉 了 文件 作用 域 的 sa， 
* 多 参 MyTest 覆 盖 掉 了 文件 作 城 的 MyTest 吉 构 体 类 型 

*/ 

static void Foo(int16 t sa, double MyTest ) ， 


A/ 
* 


企 文件 作用 域 定义 了 后 数 Foo， 其 形 参 列 展 参 对 象 具有 语句 块 作用 域 。 

* 其 中 该 函数 的 形 参 具有 画 数 原型 作用 域 ， 这 里 的 形 参 sa 覆 盖 掉 了 文件 作用 域 的 sa， 
* 形 参 MyTest 和 覆盖 掉 ] 文件 作 域 的 MyTest 结 构 体 类 型 

*/ 

static void Foo(int16 t sa, double MyTest) 

{ 


printf("sa = %d, MyTest = %f\n", sa, MyTest); 


// 这 条 语句 信息 量 很 大 ! 

// 这 里 通过 显 式 加 上 struct 以 指明 所 使 的 MyTest 是 文件 作用 域 的 结构 体 类 型 。 
// 然后 ，,f = MyTest 表达 式 中 所 引 的 MyTest 标 识 符 指 代 的 是 形 参 对 象 。 
struct MyTest mt = { .a = Sa .f = MyTest }; 


= 


bem Le sum result: %f\n", mt.a + mt.f); 
}  ”// 这 里 ，Foo 函 数 语句 块 作用 域 结束 


int main(int argc, const char* argv[]) 


// 这 里 调用 文件 作用 域 的 Fo0 典 数 ， 并 引用 了 文件 作用 域 的 sa 整 型 对 象 
Foo(sa, 100.5); 


// 在 main 函 数 体 的 语句 块 作用 域 声 明了 整 型 对 象 aa 
int aa = 0) 


if(sa > 0) 


T 
NE 


// 这 里 if 语 句 块 的 作 


履 盖 了 main 画 数 体 的 语句 块 作用 域 
// 这 里 在 if 语 句 块 作用 域 中 声明 了 sa 整 型 对 象 ， 将 文件 作用 域 的 sa 给 覆盖 掉 了 


int sa = aa; 


TT 


// 这 里 在 if 语 句 块 作用 霹 其 外 部 语句 块 的 aa 对 象 覆 盖 掉 。 
// 这 里 要 注意 的 是 ， 在 吉明 语句 中 二 下 出 现 像 这 里 的 ijnt aa 对 象 标识 符 的 声明 ， 
// 那么 该 对 象 标 识 符 立 即 生效 。 所 以 = 操作 符 右 边 的 aa 也 表示 这 里 刚 声 明 的 对 象 aa， 
// 而 不 是 外 部 语句 块 作 用 域 中 的 aa。 所 以 对 于 以 下 语句 编译 器 会 发 出 警告 

// “变量 aa 未 被 初始 化 ， 它 自身 给 自己 初始 化 了 ” 

int aa = aa + sizeof(aa); 
aa 二 Sa - 10 


// 这 里 printf 画 数 中 的 实 参 aa 与 sa 都 是 此 if 语 句 块 作用 域 中 声明 的 对 象 ， 
// 所 以 这 里 aa 是 -10，sa 为 0， 结 果 为 -10 
printf("inner Sum = %d\n", aa + sa); 

}  // 这 里 ，if 语 句 块 作 域 结束 


// 这 里 printf 画 数 中 的 实 参 aa 是 此 main 画 数 体 语句 块 作用 域 中 声明 的 对 象 ， 
// sa 则 是 文件 作用 域 中 声明 的 对 象 。 这 里 aa 是 09，sa 是 10， 所 以 结果 是 10。 
printf("outer Sum = %d\n", aa + sa); 


// 在 for 语 句 中 声明 的 对 象 具有 当前 for 语 句 块 的 作用 域 。 
// 因此 ， 这 里 的 aa 把 外 部 声明 的 aa 对 象 给 覆盖 掉 了 ， 

// 这 里 省 略 ] { 但 此 for 语 句 块 作 域 到 printf 数 j 
for(int aa = 0; aa < 10; aa++) 

printf("loop aa = %d\n", aa); 


// 这 里 外 部 aa 的 值 仍然 为 9 
printf("outer aa = %d\n", aa); 


作用 域 为 for 语 句 块 的 作用 域 。 
的 ;符号 后 结束 


3H 开 


// 这 里 在 main 范 数 语句 块 作用 域 定义 了 MyTest 结 构 体 类 型 ， 
// 将 文件 作用 域 中 定义 的 MyTest 结 构 体 类 型 给 覆盖 掉 了 
struct MyTest 


float f; 

int 1i; 
}; 
// 这 里 引用 的 是 main 函 数 语句 块 作用 域 中 的 MyTest 结 构 体 
Struct MyTest mt = { -10.5f，100 }; 


if(aa == 0) 
goto Foo; 


puts("Hello, world!"); 
// 这 里 在 函数 作用 域 中 声明 了 作为 跳 转 标签 的 Foo 


尽管 存在 表示 跳 转 标签 的 Foo，f 不 妨碍 对 Foo 画 数 的 调用 。 
// 因为 当 Foo 出 现在 goto 后 面 ， 则 表示 跳 转 标签 ; 加 

作为 函数 调用 表达 式 出 现 ， 则 作用 画 数 标识 符 ， 这 一 点 C 语 言 编译 器 能 做 出 准确 区 分 。 
// 它们 属于 两 种 不 同 的 名 字 空 间 

Foo(mt.i, mt.f); 

puts("Completed!"); 


Foo: 


| 工 
NE 


二 | 
dl 


x 


代码 清单 11-5 展 示 了 比较 完整 的 标识 符 重 定义 以 及 作用 域 玛 交 特 
性 。 在 不 同 作用 域 ， 如 有 果 标 识 符 所 指 代 的 类 别 不 一 样 ， 编 译 右 可 以 通 
过 表达 式 以 及 语句 的 表达 形式 做 出 区 分 ， 比 如 是 结构 体 类 型 还 是 某 个 
对 象 标识 符 ， 还 是 函数 标识 符 或 跳 转 标签。 如 采 是 相同 类 别 的 ， 那 么 
内 部 作用 域 的 对 象 会 把 外 部 作用 域 的 给 履 兰 掉 。 


11.1.6 ”标识 从 的 名 字 空 间 


本 闻 是 对 上 一 节 的 补充 说 明 。C 语 言 标 准 明确 指出 ， 如 果 同 一 标 
识 符 的 多 个 声明 在 某 个 翻译 单元 中 的 任 一 点 可 见 ， 那 么 C 语 言 实现 的 
语法 上 下 文 将 通过 不 同 实体 类 别 来 消除 歧义 。 所 以 ， 在 C 语 言 中 对 于 
不 同类 别 的 标识 符 具有 自己 独立 的 名 字 空 间 (namespace) 。 


C 语 言 标准 指定 了 4 类 名 字 空间 ， 
跳 转 标签 名 ， 跳 转 标 签 可 以 在 其 声明 与 使 用 过 程 中 在 语法 上 加 以 
区 分 。 
结构 体 、 联 合体 以 及 枚 举 的 标签 (tag) : 根据 关键 字 stmet 、 


union 以 及 enum 加 以 区 分 。 注 意 ， 这 三 者 属于 同一 名 字 空 间 。 


结构 体 与 联合 体 的 成 员 (member) : 通过 结构 体 或 联合 体 对 象 的 
成 员 访问 操作 符 “. "或 >” 进 行 区 分 。 


ee 
明 符 声明 的 标识 符 ， 或 是 作为 枚 举 常 量 。 


这 里 要 注意 的 是 ， 同 一 类 别 的 名 字 空 间 是 无 法 进行 区 分 的 ， 而 C 
语言 标准 将 结构 体 、 联 合体 以 及 枚 举 标 签 都 放 在 一 类 ， 这 了 驶 说 明了 结 
构 体 、 联 合体 以 及 枚 举 的 类 型 标识 符 是 无 法 同时 存在 于 同一 作用 域内 
的 。 代 码 清单 11-6 进 一 步 朱 述 了 在 同一 作用 域内 不 同名 字 裤 间 类 别 的 
标识 符 的 使 用 。 


代码 清单 11-6 ”标识 符 的 名 子 空 间 


#include <stdio.h> 


// 在 文件 作用 域 声明 了 一 个 整 型 对 象 sa 


static int sa = 10; 


// 在 文件 作用 域 定义 ] 一 个 结构 体 类 型 sa, 
// 由 于 结构 体 标签 与 普通 对 象 标识 符 属于 不 同 的 名 字 空间 ， 因 此 这 里 可 以 直接 使 用 
struct sa 


* 在 文件 作用 域 定义 ] 一 个 枚 举 类 型 SA。 
于 枚 举 标签 2 与 结构 体 标签 Ea 于 同一 名 字 空 间 ， 


* 因此 这 里 不 能 使 用 sa 作为 枚 举 类 型 的 标识 符 
本 
enum SA 
// 于 枚 举 常 量 刁 与 对 象 标识 符 同 属 电 站 六 | 个 名 字 空 间 ， 
// 因此 这 里 不 能 jsa 作 为 枚 举 常量 示 识 符 
SA1, 
SA2 
}; 
py 
机 在 文人 E 用 域 中 定义 了 联合 体 类 型 un， 
* 同样 ， 由 于 联合 本 标签 与 结构 体 标签 属于 同一 名 字 空 间 ， 
* 因此 这 里 不 能 使 用 sa 作为 联合 体 类 型 的 标识 符 
*/ 
union un 


// 这 里 可 以 用 sa 作为 该 联合 体 的 成 员 


// 同样 ， 这 时 也 能 用 un 作为 该 联合 体 的 成 员 
float un; 


}; 


二 里 在 文件 作 域 定义 了 画 数 SA。 加 四 

时 也 标识 符 的 名 字 空 间 ， 因 此 与 枚 举 类 型 不 冲突 。 

#9 参 对 象 sa 局- 语句 块 作用 域 ， 因 此 与 文件 作用 域 的 sa 也 不 冲突 
WA 
static void SA(int sa) 


// 这 里 引用 的 是 SA 函数 的 语 名 ] 
printf("sa = %d\n", sa); 


天 作用 域 中 的 形 参 对 象 sa 


int main(int argc, const char* argv[]) 


{ 


// 这 里 用 文件 作用 域 的 枚 举 类 型 SA 声明 了 对 象 es， 
// SA2 枚 举 常量 对 其 初始 化 
enum SA es = SA2 | 


了 文件 作用 域 的 函数 SA， 
// 并 用 文件 作用 域 对 象 sa 与 语句 块 作用 的 es 对 象 的 和 作为 实 参 


Ns 
入 
[a 
| 
Dn 
Ei 


域 的 sa 结构 体 类 型 声明 了 对 象 s 
{ es, 10.5f }; 


的 联合 体 类 型 un 声明 了 对 象 un， 
的 对 象 s 的 成 员 f 对 其 un 成 员 进行 初始 化 
{ .un = s.f }; 


// 这 里 访问 的 是 声明 在 语句 块 作用 域 的 对 象 un 的 un 成 员 
printf("un is: %f\n", un.un); 


// 以 下 这 条 语句 错误 ! 因为 以 下 语句 声明 的 es 标识 符 属于 
// 而 在 此 语句 世 内 ， 已 经 声明 ] es 标识 符 作为 枚 举 类 
int es = 0; 


让 
SS 
[a 
上 
下 

9 4 

tT 

I 
\=| 


ww 
ey 
[a 

Hh 

让 

HHI: 
Xt 

上 -上 
1 AT TT 


CH :- 
NTT 
f 


也 标识 符 名 字 
型 的 对 象 ， 它 


间 ， 


I 


区 由 


于 其 他 标识 符 名 字 空 间 


// 在 语句 块 作用 域内 重新 定义 了 枚 举 类 型 SA 
enum SA { SA1, SA2, SA3 }; 


// 这 句 声明 符 没有 问题 。 因 为 这 里 声明 的 SA 作为 数据 对 象 ， 
// 向; 前 的 SA 标识 符 J 枚 举 类 型 
int SA = 0; 


// 以 下 这 条 语句 错误 ! 因为 SA 有 此 语句 块 作用 域内 已 经 被 用 作 枚 举 常 上 
// 而 数据 对 象 标识 符 的 名 字 空 间 与 枚 举 常量 标识 符 同属 于 其 他 标识 符 名 字 空 间 ， 
// 因此 会 产生 冲突 
int SA1 = SA; 


虽 


// 这 名 声明 没有 问题 ， 在 语句 块 作用 域 声 明了 sa 对 象 ， SA 对 象 对 其 初始 化 。 
// 这 里 ，sa 对 象 覆盖 了 文件 作用 域 的 sa 对 象 
int sa = SA; 


if(sa == 0) 
goto SA; 


puts("Dummy output!"); 


// 这 里 SA 用 作为 跳 转 语句 标签 ， 因 此 与 上 面 同一 语句 块 作用 域 中 的 用 作 枚 举 类 型 ， 
// 以 作 整 型 对 象 的 标识 符 不 冲突 。 
// 而 C 语 言 更 是 将 跳 转 标签 专门 独立 出 一 个 作 


SA: 
SA = sa + 1; 


printf("SA = %d\n", SA); 


代码 清单 11-6 介 绍 了 在 同一 作用 域内 ， 同 一 标识 符 能 同时 指 代 不 
同 实 体 的 效果 。 当 然 ， 为 了 不 引起 混淆 ， 各 位 在 实际 项 目 中 应 当 尽 量 
避免 标识 符 重 有 的 情况 ， 尤 其 像 男 数 内 的 局 部 标识 符 覆 盖 了 文件 作用 
域 的 全 局 标识 符 ， 有 很 多 难以 发 现 的 Bug 都 是 这 种 标识 符 重 码 所 产生 
的 。 因 此 ， 这 里 对 作用 域 与 名 字 空 间 详细 的 介绍 不 是 为 了 鼓励 程序 员 
有 针对 性 地 加 以 利用 ， 更 多 的 是 告诉 C 语 言 编 译 器 的 实现 者 ， 让 这 些 
开发 者 知道 C 语 言 标准 对 作用 域 以 及 名 了 字 空间 的 实现 情况 ， 使 得 目 己 


开发 的 C 语 言 编译 万 能 遵循 C 语 言 标准 。 


讲 完 了 C 语 言 程序 的 作用 域 与 名 字 空 间 。 下 面 三 节 将 介绍 C 语 言 中 
对 象 与 函数 的 连接 (linkage) 。C 语 言 标准 中 ， 一 个 对 象 或 函数 标识 
符 可 以 在 不 同 作用 域 或 同一 作用 域内 进行 多 次 声明 ， 而 这 些 重 复 的 声 
明 可 以 通过 称 为 连接 的 过 程 来 引用 同一 对 象 或 函数 。C 语 言 中 一 共有 
三 种 连接 类 型 : 外 部 连接 (external linkage) 、 内 部 连接 (internal 


linkage) 与 无 连接 (none) 。 下 面 我 们 将 分 别 介绍 这 些 相 关内 容 。 


11.2 ”全 局 对 和 象 与 芳 数 


用 extern 存 储 类 说 明 符 (storage-class specifier) 声明 的 对 象 与 函数 
具有 外 部 连接 。 对 于 一 个 数据 对 象 ， 如 果 只 有 全 extern 的 声明 ， 那 么 它 
还 不 具有 一 个 实体 ， 只 有 当 它 在 文件 作用 域 中 用 不 溃 extern 的 声明 之 后 
才 具 有 实体 ， 并 且 作为 一 个 全 局 对 象 。 对 于 一 个 函 数 ， 如 采用 extern 或 
缺 省 存储 类 说 明 符 对 函数 声明 ， 那 么 该 函数 具有 外 部 连接 。 如 采 只 声 
明了 一 个 函数 原型 ， 那 么 该 男 数 也 没有 实体 ， 只 有 对 该 函数 定义 之 后 
才 有 实体 。 在 定义 函数 时 ， 如 果 用 extern 或 缺 省 存储 类 说 明 符 进行 定 
义 ， 那 么 函数 具有 外 部 连 授 ， 并 且 称 该 画 数 为 全 局 函数 。 


另外 ，C11 标 准 也 明确 指出 ， 在 C 语 言 未 来 版 本 中 ， 存 储 类 说 明 符 
应 该 只 能 放 在 整个 对 象 与 函数 声明 的 最 前 面 ， 而 不 能 放 在 其 他 位 置 。 


全 局 对 象 与 函数 的 声明 在 同一 翻译 单元 中 可 出 现 多 次 ， 即 便 是 在 
同一 作用 域 中 。 然 而 ， 对 对 象 的 定义 只 能 有 一 次 。 如 果 在 声明 一 个 全 
局 对 象 的 同时 ， 又 对 它 进 行 初 始 化 ， 那 么 此 时 这 声明 就 对 该 对 象 进 行 
了 定义 ， 同 时 该 对 象 也 具有 了 实体 。 对 全 局 对 象 与 国 数 的 定义 只 能 
一 次 ， 否 则 在 连接 时 ， 连 接 需 会 报 重 定义 外 部 符号 的 连接 错误 。 


代码 清单 11-7 展 示 了 全 局 对 象 与 函数 的 声明 与 定义 。 


代码 清单 11-7 全 局 对 象 与 钞 数 的 声明 与 定义 


/xx 以 下 是 test.,c 源 文件 里 的 内 容 */ 
// 声明 了 具有 外 部 连接 的 全 局 对 象 ga 
extern int ga; 


// 这 里 再 次 声明 具 外 部 连接 的 全 局 对 象 ga， 

// 然而 此 时 ga 对 象 仍然 不 具备 实体 。 

// 另外 ， 由 于 ga 的 实体 是 在 main. c 翻 译 单元 中 产生 的 ， 因 此 这 里 对 ga 的 声明 必须 加 extern， 
// 否则 会 引发 连接 时 的 符号 重 定义 错误 


// 声明 了 具有 外 部 连接 的 全 局 函数 test 
extern void test(void),; 


// 再 次 声明 具有 外 部 连接 的 全 局 函数 test， 
// 这 里 缺 省 了 存储 类 说 明 符 extern， 但 默认 为 extern 
void test(void); 


| 


// 这 里 对 test 进 行 定义 。 
// 在 函数 定义 时 ， 通 常 extern 缺 省 ， 也 
void test(void) 


TI 
ZX 让 
3 
AAA 


当前 函数 为 具有 外 部 连接 的 全 局 函数 


ga = 190; 
} 
/xx 以 下 是 main,c 源 文件 中 的 内 容 */ 


#include <stdio.h> 


// 声明 了 全 局 对 象 ga,， 此 时 ga 具有 了 实体 
int ga; 

// 再 次 声明 了 全 局 对 象 ga 

int ga; 


// 这 里 声明 了 全 局 函数 test， 使 得 test 标 识 符 在 当前 翻译 单元 中 可 见 。 

// 于 在 test ,c 中 已 经 对 画 数 test 做 了 定义 ， 所 以 在 main.c 中 就 不 能 再 次 对 它 定义 ， 
// 否则 在 连接 时 会 报 test 符 号 重 定义 的 错误 
extern void test(void),; 


// 声明 了 具有 外 部 连接 的 全 局 对 象 na， 此 时 ma 已 具备 实体 
int ma; 
// 再 次 声明 了 全 局 对 象 ma， 同时 对 它 进行 初始 化 。 此 时 ， 这 个 声明 就 是 对 ma 的 定义 


int ma = 10; 


// 这 里 仍然 可 以 对 ma 做 声明 
int ma; 
// 这 里 错误 ! > 前 对 全 局 对 象 ma 做 过 初始 化 ， 


和 同化 安 引 发 具 器 答 吾 导 尺 的 连 车 接 错 误 


// 因 比 这 时 
int ma = 20; 


一 仆 


int main(int argc, const char* argv[]) 


// 全 局 函数 与 对 象 的 声明 也 可 放 在 语句 块 作 用 域 ， 
// 使 得 当前 作用 域 对 此 标识 符 可 见 
void test(void); 


// 在 语句 块 作用 域 中 对 具有 外 部 连接 的 对 象 进行 声明 时 ， 

// 必须 添加 extern 存 储 类 说 明 符 ， 否 则 声 明 的 标识 符 将 不 具 了 连接， 

// 而 是 作为 该 语句 块 作用 域 中 的 局 部 对 象 ， 而 覆盖 掉 文件 作用 域 的 全 局 对 象 
extern int ma; 


// 调用 全 局 函数 test 
/ 


) 
// 在 当前 的 main .c 翻 译 单 元 以 及 test , 翻译 单元 中 ， | 
// 全 局 对 象 标识 符 ga 都 指 代 同一 个 实体 ， 而 全 局 函数 test 也 是 同一 个 函数 实体 
printf("result is %d\n", ga + ma); 


[a 


代码 清单 11-7 中 含有 两 个 源 文件 test.c 与 main.c 的 代码 ， 这 样 可 以 
将 这 两 个 源 文件 分 别 作为 两 个 不 同 的 翻译 单元 ， 从 而 体现 出 具有 外 部 
连接 的 全 局 对 象 与 男 数 标识 符 都 引用 的 是 同一 个 实体 。 各 位 在 上 机 实 
践 时 ， 也 是 分 别 用 两 个 源 文 件 来 输入 这 些 代码 ， 并 且 将 这 两 个 源 文 件 
放 在 同一 项 目 工程 目 孙 下 的 。 代 码 清单 11-7 展 示 了 具有 外 部 连接 的 全 
局 对 象 与 画 数 的 特性 以 及 在 使 用 时 需要 注意 的 地 方 。 这 里 要 注意 的 
征 ， 在 一 个 源 文 件 中 对 具有 外 部 连接 的 对 象 或 函数 做 了 定义 ， 使 得 它 
有 了 实体 之 后 ， 那 么 在 其 他 源 文 件 中 束 不 能 再 次 对 它 进行 定义 ， 否 则 
会 引发 连接 时 的 符号 重 定义 错误 。 在 其 他 源 文 件 中 ， 为 了 能 使 得 当前 
翻译 单元 识别 到 此 符号 的 存在 ， 只 能 对 具有 外 部 连接 的 全 局 对 象 或 函 
数 进行 声明 。 另 外 ， 还 需要 注意 的 是 ， 对 不 产生 实体 的 全 局 对 象 做 外 
部 声明 时 需要 加 上 extern 存 储 类 说 明 符 ， 否 则 也 会 引发 连接 时 的 符号 重 


定义 错误 。 


11.3 ”静态 对 象 与 函数 


用 存储 类 说 明 符 static 修 所 的 对 象 与 函数 称 为 衣 仿 对 象 与 图 数 。C 
语言 标准 明确 指出 ; 如 采 一 个 对 象 或 画 数 的 声明 在 一 个 文件 作用 域 
中 ， 并 且 包 含 static 存 储 类 说 明 符 ， 那 么 该 对 象 或 画 数 具有 内 部 连接 。 
然而 ， 与 全 局 对 象 不 同 ， 静态 对 象 除了 可 以 定义 在 文件 作用 域 之 外 ， 
还 可 以 定义 在 语句 块 作用 域 中 ， 而 定义 在 语句 块 中 的 静态 对 象 没 有 连 
接 。 与 金 局 对 象 与 男 数 类 似 的 是 ， 静 仿 对 象 与 国 数 的 声明 也 可 以 在 同 
一 文件 作用 域 中 出 现 多 次 ， 但 是 在 同一 文件 作用 域 中 对 静态 对 象 的 初 
台 化 只 能 出 现 一 次 ;同样 ， 对 静态 函数 的 定义 也 只 能 出 现 一 次 。 对 C 
语言 中 的 函数 而 言 ， 无 论 是 具有 外 部 连接 的 全 局 函数 还 是 具有 内 部 连 
接 的 静态 函数 ， 都 只 能 在 文件 作用 域内 进行 定义 ， 同 时 也 只 有 具有 外 
部 连接 的 全 局 函数 才 可 以 在 语句 块 作用 域 中 声明 ， 而 具有 内 部 连接 的 
静态 函数 则 不 允许 在 语句 块 作 用 域内 声明 。 同 时 ， 如 有 果 一 个 静态 对 和 象 
声明 在 语句 块 作用 域 中 ， 那 么 不 能 对 它 进 行 重 复 声 明 。 因 为 在 语句 块 
作用 域 中 ， 对 一 个 静 仿 对 象 的 声明 整 已 经 相当 于 对 它 的 定义 ， 它 已 经 
被 实例 化 了 ， 无 论 它 有 没有 同时 被 初始 化 。 


另外 ， 与 外 部 连接 不 同 的 是 ， 上 共有 内 部 连接 的 静态 对 象 与 函数 并 
不 是 在 整个 程序 或 库 中 指 代 同 一 个 实体 ， 而 是 在 其 各 目的 翻译 单元 中 
指 代 同 一 对 象 或 函数 。 而 一 个 翻译 单元 也 束 是 我 们 通 彰 所 谓 的 一 个 C 


源 文 件 。 因 此 ， 如 采 我 们 在 两 个 C 源 文件 ， 比 如 ac 和 b.c 中 ， 都 在 文件 
作用 域 定义 了 一 个 静态 对 象 ， 比 如 
当 编 译 之 后 ，a.c 编 译 之 后 所 产生 的 目标 文件 a.o 与 b.c 编 译 后 所 产生 的 目 
标 文 件 b.o 中 各 自 都 含有 一 个 名 为 staticObject 的 、 具 有 内 部 连接 的 整 型 
对 和 象 实体 ， 因 此 当 连 毛 妖 在 连接 之 后 ， 这 两 个 对 象 将 古 同 时 存在 的 ， 
而 它们 在 各 目的 翻译 单元 中 分 别 表示 当前 所 处 翻译 单元 中 的 状态 。 


“static int staticObject; ”， 那 么 


静态 对 象 的 情况 比较 复杂 ， 我 们 通过 代码 请 单 11-8 这 一 详细 的 示 
例 代 码 做 细节 上 的 进一步 讲解 。 


代码 请 单 11-8 静态 对 象 与 函数 


/** 以 下 是 test,c 源 文件 里 的 内 容 */ 
#include <stdio.h> 


// 在 test,c 翻 译 单元 中 声明 静态 对 象 Sa， 并 对 它 用 -10 进 行 初始 化 
static int Sa = -10; 


static void SFoo(void) 
Sa++， 


printf("sa in %s = %d\n", __FILE , sa); 


// 这 里 定义 了 具有 外 部 连接 的 全 局 函数 test， 用 于 间接 调用 具有 静态 连接 的 SFoo 函 数 以 观察 结果 
void test (void) 


SFoo(); 
/** 以 下 是 main,c 源 文件 中 的 内 容 */ 


#include <stdio.h> 


// 在 文件 作用 域 声明 静态 对 象 Sa，sa 具 有 内 部 连 # 


static int sa; 


// 这 里 再 次 声明 静态 对 象 sa， 并 对 它 进行 初始 化 
static int sa = 100; 


// 这 里 对 静态 对 象 sa 进行 再 次 声明 ， 但 不 能 再 进行 初始 化 
static int sa; 


// SFoo 函 数 在 文件 作用 域内 被 定义 为 静态 函数 ， 从 而 具有 内 部 连接 


static void SFoo(void) 


// 在 语句 块 作 或 中 声 明 静 态 对 象 ， 则 立即 对 它 进行 了 实例 化 的 定义 。 

// 声明 在 语句 块 作用 域 的 静态 对 象 尽管 没有 连接 ， 但 它 的 行为 就 类 似 于 文件 作用 域 的 静态 对 象 。 
// 当 第 一 次 调 SFoo 丽 数 ， 这 里 inner 静 态 对 象 即 被 初始 化 。 
// 而 当 第 二 次 调用 SFoo 画 数 时 ，inner 静 态 对 象 不 会 被 再 次 初始 化 ， 但 还 保留 着 之 前 的 值 
static int inner = 100; 


// 下 面 再 用 static 对 ijnner 对 象 进行 声明 ， 编 译 器 会 报 inner 重 定义 的 错误 
// static int inner; 


// 在 每 次 调用 SFo0 函 数 时 ， 都 对 inner 静 态 对 象 做 一 次 自 增 操作 
inner++; 


printf("inner = %d, sa = %d\n", inner, sa); 


} 
int main(int argc, const char* argv[]) 
{ 
// 以 下 声明 错误 ! 在 语句 块 作用 域 中 不 允许 声明 静态 函数 
static void SFoo(void); 
// 第 一 次 调用 SFoo 函 数 时 ，inner 静 态 对 象 被 初始 化 ， 随 后 做 了 一 次 自 增 操作 
// 所 以 这 里 将 输出 : inner = 101 
SFoo(); 
// 当 第 二 次 调用 SFoo 函 数 时 ，inner 静 态 对 象 没 有 再 次 初始 化 ， 
// 但 保留 了 上 次 的 结果 101， 随后 也 做 了 一 次 自 增 操 作 ， 所 以 这 里 输出 : inner = 102 
SFoo(); 
// 这 里 声明 test 全 局 函数 
extern void test(void),; 
// 通过 两 次 调用 定义 在 test .c 中 的 全 局 函数 tes 
// 以 观察 在 test. 0 中 定 和 的 sa 静 访 对 名 以 及 S00 各 态 而 数 的 状态 
test(); 
test(); 
// 这 里 声明 静态 sa 将 把 文件 作用 域 的 静态 对 象 Sa 给 覆盖 掉 ， 
// 同 乓 这 里 的 sa 将 不 具有 连接 
static int sa = 0; 
printf("inner sa = %d\n", sa); 
// 我 们 通过 再 次 调用 SFoo 画 数 可 以 观察 到 文件 作用 域 中 定义 的 sa 对 象 的 当前 值 
SFoo(); 
} 


代码 清单 11-8 也 同样 创建 了 两 个 C 源 文件 ， 一 个 名 为 test.c， 男 一 
个 名 为 main.c。 我 们 看 到 ，test.c 中 的 sa 静态 对 象 与 main.c 中 的 sa 静态 对 
象 是 两 个 不 同 的 实体 ， 两 者 都 分 别 作用 在 目 己 的 翻译 单元 上 下 文中 。 
同样 ，test.c 中 的 SFoo 静 态 画 数 与 main.c 中 定义 的 SFoo 静 态 函 数 也 是 两 
个 不 同 的 函数 实体 ， 里 面 的 实现 也 完全 不 一 样 ， 但 标识 符 完 全 一 样 ， 


它们 有 具有 内 部 连接 。 因 此 连接 硕 在 做 符号 连接 时 ， 在 当前 目标 文件 中 
具有 内 部 连接 的 符号 惑 作 为 当前 上 下 文 的 一 个 实体 ， 而 对 于 具有 外 部 
连接 的 符号 ， 则 需要 全 局 考虑 。 分 布 在 各 个 目标 文件 中 的 同一 个 具有 


， 最 终 都 将 指 代为 同一 个 实体 。 所 以 ， 从 这 点 上 来 


外 部 连接 的 符号 
看 ， 具 有 外 部 连接 的 对 象 与 钞 数 是 名 副 其 实 的 全 局 对 象 与 范 数 。 


11.4 局 部 对 象 


声明 为 一 个 函数 形 参 、 或 者 在 一 个 语句 块 作用 域内 没有 用 extern 或 
static 存 储 类 说 明 符 声明 的 对 象 称 为 局 部 对 象 (local objects) 。 之 前 提 
到 过 ， 声 明 在 语句 块 作用 域 中 的 静态 对 象 不 具有 连接 ， 在 此 对 于 不 具 
有 连接 的 对 和 象 的 范围 义 进一步 扩充 了 一 一 局 部 对 象 也 不 具有 连接 。 因 
此 ， 对 于 对 象 的 连接 分 类 现在 束 很 明确 了 一 一 在 文件 作用 域 用 extern 存 
储 类 说 明 符 或 不 用 任何 存储 类 说 明 符 声明 的 对 象 ， 以 及 在 语句 块 中 用 
extern 存 储 类 说 明 符 声明 的 对 象 具有 外 部 连接 ; 在 文件 作用 域 中 用 
static 存 储 类 说 明 符 声明 的 对 象 具 有 内 部 连接 ;， 其余 的 部 没有 连 授 。 当 
然 ， 之 前 也 提 到 过 ， 画 数 只 能 被 定义 在 文件 作用 域 ， 而 只 有 具有 外 部 
连接 的 函数 才 可 以 声明 在 语句 块 作用 域内 。 同 时 ， 函 数 必 须 具 有 和 连 
接 ， 不 古 外 部 连接 束 是 内 部 连 授 。 


各 位 对 局 部 对 象 应 该 已 经 是 相当 邵 悉 了 。 像 作为 函数 的 形 参 的 对 
象 ， 以 及 在 语句 块 作用 域 中 声明 的 不 市 任何 存储 类 说 明 符 的 对 象 都 属 
于 没有 连接 的 局 部 对 象 。 局 部 对 象 只 对 它 所 在 的 作用 域内 可 见 ， 并 且 
出 了 它 所 在 的 作用 域 ， 那么 它 的 生命 周期 也 整 结 束 了 。 


这 里 ，C 语 言 中 还 有 一 个 auto 存 储 类 说 明 符 以 及 register 存 储 类 说 明 
符 来 声明 一 个 局 部 对 象 。 在 早期 C 语 言 中 (尤其 还 没有 被 标准 化 


时 ) ，auto 关 键 字 用 于 显 式 声 明 一 个 对 象 是 局 部 变量 ， 它 不 具有 连 
接 ， 其 生命 周期 也 是 由 函数 实现 上 自动 回收 的 。 我 们 之 前 提 到 过 ， 画 数 
中 定义 的 局 部 对 象 往往 是 存放 在 栈 空间 的 ， 当 函数 返回 前 ， 该 玉 数 所 
用 的 栈 会 被 推出 ， 使 得 该 函数 之 前 所 持 有 的 局 部 对 象 全 都 被 目 动 销 
毁 ， 所 以 局 部 对 象 在 那 时 也 被 称 为 目 动 的 。 而 现代 C 语 言 (在 C90 标 准 
确立 后 ) ，auto 关 键 字 就 被 逐步 废弃 了 。 而 register 存 储 类 说 明 符 则 是 
暗示 C 语 言 编译 征 ， 当 前 声明 的 对 象 最 好 被 存放 在 寄存 器 中 ， 由 于 它 
可 能 被 重复 使 用 而 应 该 得 到 了 最 快速 的 访问 。 然 而 ， 现 代 C 语 言 编 译 句 
做 得 越 来 越 智 能 ， 尤 其 是 目 动 内 联 函 数 、 循 环 展开 优化 等 技术 成 熟 之 
后 ， 优 化 策略 也 丰富 得 多 ， 因 此 当前 编译 器 能 自己 更 好 地 合理 分 配 寄 
存 器 ， 我 们 使 用 register 关 键 字 往往 会 阻碍 编译 器 的 进一步 优化 ， 所 以 
从 C 语 言 下 一 个 版 本 的 标准 起 ， 标 准 委 员 会 可 能 会 逐步 弃 用 register 关 
键 字 或 者 为 它 赋予 一 种 新 的 语义 ， 因 此 大 家 在 当前 的 C 语 言 代码 中 尽 
量 避 人 免 这 两 个 天 键 字 ， 除 韭 有 些 编译 絮 对 它们 做 了 语义 上 的 扩展 ( 比 
如 ，auto 在 C++ 中 已 经 被 用 作 可 目 动 推导 的 类 型 ) 。 


代码 清单 11-9 简 单 地 给 大 家 介绍 了 声明 局 部 对 象 时 的 auto 与 register 
存储 类 说 明 符 的 使 用 方式 。 


代码 清单 11-9 局 部 对 象 以 及 auto 与 register 存 储 类 说 明 符 


#include <stdio.h> 


A 
Fe 


这 里 在 文件 
* 其 形 参 对 


牛 作用 域 定义 了 具有 内 部 连接 的 静态 函数 foo， 
象 a 和 b 都 是 无 连接 的 局 部 对 象 人 


、 


中 ， 形 参 b 用 register 存 储 类 说 明 符 修 饰 ， 
编译 器 将 此 形 参 对 象 尽 量 存放 在 寄存 器 中 


不 绑 


丝 


了 并 


* n 


*/ 
static void foo(int a, register int b) 


printf("sum = %d\n", a + b); 


int main(int argc, const char* argv[]) 


foo(100, 200); 


// 这 旦 启明 了 一 个 目 动 局 部 对 象 @,， 类 记 站 
// 其 语义 与 int a 没 有 差别 。 此 外 ，auto 存 储 类 说 明 符 不 能 用 于 声明 一 个 函数 形 参 对 象 


auto int a = 10; 


// 这 里 用 register 存 储 类 说 明 符 声明 了 对 象 r， 上 暗示 编译 器 将 对 象 r[ 尽 量 存 放 在 寄存 器 中 


register int r = 20; 
// 以 下 语句 会 引发 编译 错误 ! 由 于 寄存 器 类 型 的 对 象 在 概念 上 “没有 存储 器 地 址 ”， 
// 因此 ,不 能 对 register 修 饰 的 对 象 做 取 地 址 操作 

int *p = &r; 


printf("value is: %d\n", a + r); 


代码 清单 11-9 中 也 谈 到 了 使 用 register 存 储 类 说 明 符 声明 的 对 象 在 
使 用 时 的 限制 ， 既 然 一 个 对 象 古 上 暗示 用 于 存放 在 寄存 紫 中 的 ， 那 么 它 
忠 不 具有 存储 器 地 址 所 以 我 们 不 能 将 它 作 为 地 址 操作 符 的 操作 数 。 此 
外 ，auto 存 储 类 说 明 符 不 能 用 于 修饰 一 个 形 参 对 象 。 


11.5 “对象 的 存储 与 生命 周期 


本 世 将 描述 对 象 的 存储 与 生命 周期 。 在 C 语 言 中 ， 对 象 如 采 从 存 
储 区 域 进行 划分 的 话 ， 可 分 为 全 局 数据 存储 区 、 栈 存储 区 以 及 被 动态 
分 配 的 堆 存储 区 。 而 全 局 数据 存储 区 又 可 分 为 可 读 写 存储 区 以 及 只 读 
存储 区 。 只 读 存 储 区 也 称 为 常量 存储 区 。 


之 前 在 第 1 章 中 ， 我 们 提 到 了 者 干 C 语 言 源 文 件 从 编译 到 连接 ， 基 
终生 成 可 执行 文件 的 流程 。 可 执行 文件 中 就 包含 了 对 函数 (指令 
码 ) 、 全 局 数据 分 布 的 描述 。 当 我 们 点 击 可 执行 文件 ， 或 是 在 控制 台 
中 输入 可 执行 文件 名 然后 按 回 车 键 之 后 ， 操 作 系 统 目 之 的 特定 加 载 右 
就 根据 可 执行 文件 中 所 描述 的 函数 以 及 全 局 对 象 的 布局 分 配 相应 的 存 
储 空 间 。 画 数 代码 一 般 会 被 加 载 到 指定 的 指令 存储 区 ; 一 些 全 局 音量 
(比如 字符 串 字 面 量 ) 根据 实现 ， 可 能 会 被 存放 到 常量 存储 区 ;可 被 
修改 的 全 局 数据 对 象 则 会 被 分 配 到 可 读 写 的 存储 区 。 在 大 部 分 实现 
中 ， 仅 有 一 个 声明 而 未 被 初始 化 的 全 局 对 象 会 以 零 进 行 初 始 化 ， 但 这 
个 行为 并 不 是 C 语 言 标准 明确 指出 的 ， 而 是 当前 大 部 分 环境 都 是 这 人 么 
实现 的 。 也 融 是 说 在 我 们 的 程序 正式 执行 之 前 ， 加 载 硕 已 经 给 代码 以 
及 全 局 数据 分 配 好 了 存储 空间 ， 并 且 对 全 局 对 象 完 成 了 初始 化 ， 最 后 
加 载 器 会 目 动 调用 main 芳 数 使 程序 正式 开始 执行 。 因 此 ， 全 局 对 象 的 
生命 周期 与 当前 程序 的 一 样 长 ， 直 到 当前 运行 的 程序 被 关闭 前 ， 全 局 


对 象 一 直 可 用 。 这 里 所 描述 的 全 局 对 象 包括 具有 外 部 连接 的 全 局 对 
象 ， 以 及 具有 内 部 连接 的 静态 对 象 。 


在 一 个 画 数 内 定义 的 局 部 对 象 以 及 画 数 形 参 对 象 ， 它 们 一 般 会 被 
存放 在 栈 存 储 空 间 。 它 们 的 生命 周期 从 声明 开始 ， 一 直到 函数 调用 结 
束 ， 最 后 的 栈 指针 复位 即 把 函数 中 所 有 定义 的 局 部 对 象 全 都 销毁 
外 ， 这 里 还 有 一 点 需要 提出 的 是 ， 对 于 函数 中 的 一 个 磐 套 语句 块 作用 
域 的 局 部 对 象 ， 其 生命 周期 是 从 其 声明 开始 ， 一 直到 该 语句 块 结束 ， 
而 不 是 函数 调用 结束 。 这 个 是 从 编程 语言 的 逻辑 上 来 讲 的 ， 即 便 某 个 
C 语 言 实 现 可 使 得 语句 块 作用 域 的 对 象 与 函数 的 生命 周期 一 样 长 ， 但 
我 们 不 能 做 这 种 断言 。 


之 前 已 经 提 到 过 ， 由 于 函数 的 栈 空间 十 分 有 限 ， 如 采 我 们 要 分 配 
一 段 较 大 的 存储 空间 ， 我 们 就 需要 调用 malloc 等 C 语 言 标准 库 画 数 来 做 
存储 空间 的 动态 分 配 。 动 态 分 配 的 存储 空间 由 于 传统 上 使 用 堆 数 据 结 
构 进行 管理 ， 因 此 我 们 也 把 动态 分 配 的 存储 空间 称 为 堆 空间 (heap 
memory) 。 堆 空间 的 生命 周期 从 malloc 成 功 执行 后 ， 一 直到 调用 free 
之 类 的 库 函 数 进行 释放 梭 。 这 里 大 家 要 注意 的 是 ， 如 采 一 个 指针 对 象 
指 问 了 一 个 动态 分 配 的 存储 空间 ， 那 么 后 续 如 果 还 要 用 这 个 指针 去 指 
癌 某 个 动态 分 配 的 存储 空间 ， 则 必须 先 把 之 前 动态 分 配 的 存储 空间 给 
释放 掉 ， 否 则 会 引发 内 存 泄漏 (memory leak) 。 如 果 在 一 个 程序 中 ， 
在 某 个 函数 中 不 断 动态 分 配 存储 空间 ， 却 一 直 不 释放 ， 那 么 该 程序 所 


占用 的 内 存 会 不 断 提升 ， 最 终 可 能 导致 整个 系统 运行 缓慢 ， 或 十 当前 
程序 无 法 再 申请 到 更 多 的 存储 空间 而 导致 朋 涡 。 用 malloc 库 函数 动态 
分 配 出 来 的 存储 空间 不 受 栈 的 影响 ， 所 以 即便 退出 当前 函数 ， 该 存储 
空间 仍然 有 效 ， 直 到 对 它 调用 free 进 行 释放 为 止 。 


代码 清单 11-10 展 示 了 全 局 对 象 、 局 部 对 象 以 及 动态 分 配 存 储 空间 
的 生命 周期 。 


代码 清单 11-10 对象 的 存储 与 生命 周期 


#include <stdio.h> 
#include <stdlib.h> 


// 声明 全 局 对 象 ga， 具 有 整个 程序 的 生命 
int ga; 


// 声明 静态 对 象 sa， 具 有 整个 程序 的 生命 周期 
static int sa; 


// 画 数 foo 的 形 参 对 象 a 的 生命 周期 到 函数 foo 调 用 完成 之 前 
static int* foo(int a) 


{ 
// 语句 块 作用 域 的 静态 对 象 jnner 也 拥有 整个 程序 的 生命 周期 


static int inner = 1; 


tl 


期 


已 


int *p = NULL 
if(inner > 0) 
{ 


int tmp = inner + a; 
p = &tmp; 


} 

// 这 里 用 指针 p 去 引用 if 语 各 块 中 的 局 部 对 j 象 tmp 。 
// 由 于 tmp 的 生命 周期 在 逻辑 上 已 经 在 if 语 句 块 结束 后 就 结束 了 ， 
// 所 以 这 里 我 们 不 应 该 在 实际 项 目 中 做 这 样 的 引用 ， 尽管 在 macos 环 境 下 能 输出 正确 结 
if(p != NULL) 


printf("tmp = %d\n", *p); 


// 这 里 不 能 返回 对 象 a 的 地 址 ， 也 不 能 返回 对 象 p 的 地 址 以 及 指针 p 的 值 ， 
// 因为 对 象 a 与 p 都 是 画 数 foo 的 局 部 对 象 ， 其 生命 周期 在 foo 调 用 结束 后 就 全 都 
// ee dab. 本 期 为 整个 程序 的 生命 周期 ， 因 此 可 以 将 它 地 址 返回 出 来 ， 


DH 
al 
A 
ss 


A 


return &inner; 


} 


static int* test(void) 


// 动态 分 诅 了 100 个 Int 对象 存储 空间 
int *p = malloc(100 * sizeof(*p)); 


for(int i = 0; i < 100; i++) 
p[i] = i; 
// 由 于 动态 分 配 的 存储 空间 会 被 一 直 保 留 ， 直 到 它 被 释放 为 止 。 


// 因此 ， 这 里 返回 动态 分 配 存储 空间 的 首 地 址 不 会 有 任何 问题 
return p; 


int main(int argc, const char* argv[]) 


// 在 mac0S 运 行 环境 下 ，ga 与 sa 都 被 加 载 器 初始 化 为 0 


printf("ga + sa = %d\n", ga + sa); 


int *p = foo(100); 


// 这 里 通过 指针 对 象 p 间 接地 修改 了 foo 函 数 中 静态 对 象 jnner 的 值 。 
// 此 时 ，inner 的 值 变 为 了 101 
*p += 100; 


foo( -100); 


// 调用 test 函 数 之 后 ， 将 动态 分 配 的 首 地 址 传 给 main 中 声明 的 指针 对 象 p 
p = test(); 


printf("p[9] = %d, p[99] = %d\n", p[L90], pL99]); 


// 释放 p 所 指向 的 动态 分 配 的 存储 空间 ， 
// 在 test 函 数 中 动态 分 配 的 存储 空间 生 
free(p); 


证 周 期 结束 


全 


代码 清单 11-10 分 别 展示 了 全 局 对 象 、 静 态 对 象 以 及 局 部 对 象 的 生 
命 周 期 。 我 们 万 其 要 注意 的 是 ， 如 采 一 个 图 数 返 回 的 是 指针 对 象 类 
型 ， 那 么 返回 的 指针 对 象 应 该 指 网 一 个 全 局 对 象 、 静 仿 对 象 或 是 动态 
分 配 存储 空间 的 首 地 址 。 田 外 在 一 般 系统 中 ， 了 字符 串 字 面 量 属 于 全 局 
常量 ， 其 任 一 元 素 的 地 址 都 可 作为 函数 的 返回 值 。 


11.6 _Thread local 对 象 


_Thread local 关键 字 首次 在 C11 标 准 中 出 现 ， 它 也 是 一 个 存储 类 说 
明 符 ， 用 它 声明 的 一 个 对 象 表示 该 对 象 在 任 一 线程 中 是 私有 的 。 
_Thread local 可 以 与 extern 或 static 一 同 声明 ， 但 是 一 个 _Thread local 对 
象 必须 要 么 具有 外 部 连接 ， 要 么 具有 内 部 连接 。_Thread_ local 对 象 的 
生命 周期 为 “线程 存储 周期 ” (thread storage duration) ， 其 整个 生命 周 
期 从 线程 启动 执行 一 直到 线程 退出 。 当 线程 启动 执行 之 前 ， 
_Thread local 对 象 会 为 当前 线程 制作 一 个 对 象 副本 ， 然 后 将 其 值 拷贝 
到 该 副本 中 ， 此 后 ， 无 论 在 线程 中 如 何 修改 副本 值 ， 其 声明 的 原版 对 
象 的 值 是 不 受 影 响 的 。 因 此 ，_Thread_local 对 象 也 被 称 为 线程 私有 对 
象 o 


代码 清单 11-11 展 示 了 _Thread_ local 对象 的 特征 与 使 用 方式 。 
代码 清单 11-11 _Thread _ local 对象 的 使 用 


#include <stdio.h> 
#include <stdbool.h> 
#include <pthread.h> 


// 声明 一 个 静态 _Thread_local 对 象 ta， 它 具有 内 部 连接 。 
// 此 外 ， 它 是 原版 的 _Thread_local 对 象 
static _Thread_local volatile int ta = 1; 


// 声明 一 个 静态 布尔 对 象 jscomplete， 此 对 象 用 于 标识 用 户 线程 是 否 执 行 完 的 标志 
static volatile bool isComplete = false; 
/** 这 是 一 个 用 户 线程 处 理 函 数 ， 用 于 执行 一 个 用 户 线程 分 派 的 任务 */ 
static void* MyThreadProcedure(void* param) 


/7 在 启动 用 户 线程 之 前 ， 


法 


一 


本 。 


// ee 和 声明 的 静 芒 ta 对 象 复 制 色 当前 线程 作为 一 个 昌 
// 因此 ， 始 和 当前 户 线程 中 ta 副本 的 值 为 1 
printf("Firstly, ta in user thread is: %d\n", ta); 


// 这 里 将 当前 用 户 线程 的 ta 副本 赋值 为 100 
ta = 100; 


printf("ta in user thread = %d\n", ta); 


// 将 用 户 线程 执行 完成 标志 设置 为 true 
isComplete = true; 


return NULL; 


int main(int argc, const char* argv[]) 


// main 函 数 的 执行 是 在 主线 程 上 
// 始 静 态 _Thread_local 对 象 ta 被 复制 到 当前 线程 ， 
// 那么 主线 程 就 有 了 ta 的 一 个 副本 。 尽 管 我 门 在 主线 程 中 仍然 可 以 引用 ta， 
// 但 它 已 经 不 是 之 前 在 文件 作用 域 声明 的 那个 ra 了 ， 而 是 在 主线 程 中 的 -3 独立 副本 
printf("ta = %d\n", ta); 


// 这 里 将 主线 程 的 ta 副本 赋值 为 29 


pthread t thread = NULL 
// 创建 用 户 线程 并 执行 
pthread_create(&thread, NULL, &MyThreadProcedure, NULL); 


// 等 待 用 户 线程 执行 完毕 
while( !iscomplete); 


// 输出 主线 程 中 ta 副本 的 值 
printf("ta in main thread = %d\n", ta); 


代码 清单 11-11 使 用 了 现在 几乎 所 有 类 Unix 控 作 系 统 目 之 的 pthread 
库 ，Windows 系 统 也 有 对 pthread 的 支持 ， 但 可 能 需要 开发 者 自己 添加 
pthread 的 连接 库 。 如 果 各 位 无 法 正常 编译 连接 代码 清单 11-11， 可 以 在 
网 上 查询 如 何 使 用 pthread 库 ， 这 方面 的 资料 非常 多 。 此 外 ， 代 码 清单 
11-11 中 还 用 到 了 volatile 关 键 字 ， 此 关键 字 将 在 12.2 节 做 详细 介绍 。 


11.7 “本章 小 结 


本 章 主 要 给 大 家 介绍 了 C 语 言 代码 编译 的 上 下 文 以 及 不 同 种 类 的 
对 象 、 存 储 空间 在 运行 时 的 行为 和 生命 周期 。 通 过 本 章 学 习 ， 大 家 可 
以 掌握 如 何 控 制 好 对 象 与 画 数 的 连接 ， 应 该 对 公共 开放 的 函数 和 全 局 
对 和 象 作 为 外 部 连接 进行 声明 ， 而 仅 在 单个 兰 文 件 内 使 用 的 函数 和 对 和 象 
应 该 使 用 内 部 连接 。 此 外 ， 在 函数 中 声明 的 局 部 对 象 在 出 了 相应 的 语 
句 块 之 后 ， 其 生命 周期 即 结束 。 如 有 果 要 持续 保留 对 象 的 有 效 性 ， 应 该 
使 用 动态 分 配 存储 空间 。 另 外 ， 如 采 需 要 一 个 很 大 的 内 存 作为 缓存 使 
用 也 应 该 使 用 动态 分 配 的 存储 空间 ， 因 为 一 个 函数 的 栈 空间 往往 比较 
小 。 而 对 于 文件 作用 域 声明 的 全 局 对 象 以 及 静态 对 象 则 具有 整个 程序 
的 生命 周期 。 


在 本 章 最 后 一 节 谈 到 了 _Thread_ local 对 象 ， 这 种 类 型 的 对 象 是 声 
明 并 初始 化 了 之 后 ， 它 的 值 不 会 被 修改 。 当 每 个 线程 在 执行 之 前 ， 系 
统 都 会 将 该 对 象 的 值 拷贝 到 当前 线程 的 特定 存储 空间 ， 作 为 当前 线程 
的 一 个 副本 使 用 ， 所 以 每 个 线程 内 对 该 对 象 标识 符 的 引用 其 实 都 是 当 
前 线程 对 它 所 拥有 的 相应 对 象 副本 的 操作 ， 不 会 影响 到 全 局 声明 的 对 
象 本 身 。 不 过 当前 支持 _Thread_local 的 主流 编译 器 有 GCC 和 Clang， 其 
他 编译 器 可 能 对 该 特性 的 支持 比较 有 限 。 如 果 大 家 在 用 GCC 4.9 或 更 


高 版 本 ， 或 者 是 Clang 3.7 (或 Apple LLVM 7.0) 或 更 高 版 本 ， 则 可 以 
放心 大 胆 地 使 用 。 
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第 12 章 C 语 言 中 的 类 型 限定 符 


C 语 言 中 的 类 型 限定 符 (type qualifier) 用 于 指明 一 个 对 象 的 访 存 
属性 。C11 标 准 中 一 共 含有 4 种 类 型 限定 答 ， 分 别 是 const 、volatile 、 
restrict 以 及 _Atomic。 除 了 _Atomic 这 一 类 型 限定 符 比 较 特 殊 外 ， 对 于 
其 余 三 个 类 型 限定 符 ， 当 一 个 对 象 为 指针 类 型 的 对 象 时 ， 类 型 限定 符 
与 * 号 之 间 的 摆 放 位 置 不 同 ， 该 限定 符 所 修饰 的 类 型 也 会 有 所 不 同 。 此 
外 ， 这 些 类 型 限定 符 可 到 加 使 用 。 


我 们 将 在 12.1 节 中 详细 描述 除 _Atomic 以 外 的 其 他 三 种 类 型 限定 符 
的 摊 放 位 置 与 修饰 类 型 之 间 的 关系 ， 后 面 几 节 将 不 再 袭 述 。 而 类 型 限 
定 符 的 摆 放 与 对 类 型 的 修饰 也 是 C 语 言 中 的 难点 之 一 ， 希 望 各 位 能 仔 
细 阅 读 12.1 节 中 的 内 容 。 


达 信 全 


12.1 ”const 限 定 符 


const 限 定 符 用 于 修饰 一 个 对 象 ， 表 明 该 对 象 是 一 个 常量 
(constant) 。 被 const 修 饰 的 对 象 只 能 初始 化 一 次 ， 之 后 它 的 值 就 不 能 
被 修改 。 在 很 多 人 藤 入 式 系 统 中 ， 全 局 const 对 象 可 能 会 与 代码 一 起 被 存 
入 ROM 存 储 介质 中 。 


当 const 限 定 符 用 于 修饰 一 个 对 象 时 ， 如 果 将 它 放 置 于 紧 挨 着 对 象 
标识 符 的 前 面 ， 那 么 表明 该 const 修 饰 此 对 象 本 号 ， 该 对 象 的 值 束 不 能 
被 修改 。 在 这 种 情况 下 ，const 也 可 以 放置 在 类 型 的 前 面 。 像 下 面 两 条 
语句 分 别 将 对 象 4 与 对 象 b 声 明 为 常量 对 象 。 


有 nt 类 型 


int const a = 100; // 这 里 声明 常量 对 象 a,， | 
2 有 float 类 型 


const float b = 10.5f; // 这 里 声明 常量 对 象 b， 


EC 


上 述 代 码 中 ， 无 论 是 对 象 a 还 是 对 象 p， 都 不 能 对 它们 的 值 进行 修 
改 。 倘 大 通 过 指针 做 间接 引用 进行 修改 ， 那 么 行为 是 未 定义 的 ， 比 如 
以 下 代码 片段 : 


int const a = 10; // 定义 了 常量 对 象 a 
void *p = (void* )&a,; // 这 里 通过 万 用 指针 对 象 p 指 向 对 象 a 的 地 址 
*(int*)p += 10; // 然后 通过 指针 p 来 修改 对 象 a 的 值 


我 们 尝试 在 某 个 画 数 中 编写 上 述 代 码 然后 运行 ， 在 一 般 保 面 操作 
系统 中 常量 对 象 a 的 值 往往 会 变 为 20， 由 于 常量 对 象 a 的 存储 空间 在 栈 


空间 ， 栈 存储 空间 本 和 映 是 一 个 可 读 可 写 的 存储 空间 ， 因 此 在 这 种 情况 
下 即便 C 语 言 编译 万 会 对 第 量 对 象 在 编程 语言 语法 上 进行 保护 ， 但 也 
不 能 保证 在 运行 时 第 量 对 象 的 值 一 定 是 不 变 的 。 不 过 我 们 仍然 不 应 该 
通过 这 种 方式 去 修改 一 个 常量 对 象 。C 语 言 标准 明确 指出 ， 通 过 指针 
解 引 用 (dereference) 的 方式 去 修改 一 个 常量 对 象 ， 其 行为 是 未 定义 
的 。 所 谓 “ 解 引用 ”是 指 通过 对 指针 对 象 做 间接 操作 以 访问 该 指针 所 指 
对 象 的 值 。 当 然 ， 在 某 些 租 入 式 系 统 中 ， 如 果 对 一 个 存 和 ROM 的 全 局 
常量 对 象 进 行 修改 ， 那 么 在 运行 时 该 常量 的 值 要 么 不 变 ， 即 该 操作 被 
存储 融 控 制 融 视 作 为 一 个 无 效 操作 ; 要 人 么 系统 直接 发 生 异 常 。 


这 里 再 谈 谈 const 的 位 置 放置 问题 。 在 大 部 分 源 代码 中 ， 我 们 会 看 
到 const 修 饰 一 个 对 象 时 ， 往 往 会 放 在 类 型 的 前 面 。 但 在 后 面 与 指针 类 
型 结合 的 时 候 我 们 会 发 现 ， 将 const 紧 换 着 放置 于 它 所 修饰 的 对 象 标识 
符 之 前 ， 更 容易 判断 当前 修饰 的 是 哪个 类 型 ， 或 者 说 哪 一 层 解 引用 被 


视 作 一 个 第 量 。 


const 可 以 用 于 修饰 任 一 类 型 的 对 象 ， 包 括 基 本 类 型 ， 枚 举 、 结 构 
体 、 联 合体 等 用 户 目 定义 类 型 ， 以 及 各 种 指针 类 型 和 数组 元 素 类 型 。 
这 里 需要 注意 是 ， 由 于 数组 对 象 本 映 其 地 址 十 固定 不 变 的， 数组 对 和 象 
仅仅 表征 了 一 段 存储 空间 的 首 地 址 以 及 对 其 元 素 的 访问 模式 ， 所 以 C 
语言 中 没有 一 种 限定 符 能 用 于 修饰 数组 对 象 本 身 ， 限 定 符 只 能 用 于 修 
饰 数组 元 素 。 


下 面 将 分 别 介绍 const 限 定 符 如 何 修饰 普通 标量 对 象 、 数 组 元 素 、 


指针 类 型 的 对 象 ， 以 及 修饰 后 的 对 象 的 访问 状态 。 


12.1.1 const 限 定 符 修饰 普通 对 和 象 


NS 


当 const 修 饰 一 个 普通 对 象 时 ， 该 对 象 的 值 将 不 能 被 修改 。 当 一 个 
const 修 饰 一 个 复合 类 型 对 象 时 (比如 一 个 结构 体 对 象 ，， 那 么 该 结构 
体 对 象 中 的 所 有 成 员 的 值 都 不 能 被 修改 。 


代码 清单 12-1 将 展示 这 些 和 常量 对 象 的 声明 与 使 用 。 
代码 清单 12-1 ” ”const 修饰 普 通 对 象 


#include <stdio.h> 
int main(int argc, const char* argv[]) 


// 声明 了 一 个 ijnt 类 型 的 常量 对 象 a， 但 没有 对 它 初 始 化 
int const a; 


// 即便 如 此 ， 我 们 也 不 能 再 对 常量 对 象 a 进 行 赋值 ， 因 此 以 下 这 条 表达 式 是 错误 的 : 
00; 


a=1 


// 声明 了 一 个 常量 枚 举 对 象 6e， 并 用 MY_ENUM2 枚 举 值 对 它 初始 化 
enum { MY_ENUM1, MY_ENUM2 } const e = MY_ENUM2, 


// 定义 了 一 个 匿名 它 声 明了 一 个 常量 结构 体 对 象 sS， 这 里 的 const 也 能 放 在 struct 前 面 
struct 


HH 
于 
弃 


Int a; 

Struct 
float f; 
double dd; 


}inner; 
} const s={ .a= 10, .inner = { 10.5f, -20.5 } }; 


// 这 里 对 结构 体 对 象 s 中 的 任 一 成 员 ， 包 括 其 内 肉 类 型 的 成 员 ， 都 不 能 修改 


s.inner.d = 30; // 这 条 语句 是 错误 的 


printf("result = %.1f\n", e + S.a + S.inner.f - s.inner.d); 
struct Object 
{ 


int ay b; 
const int c; // 这 里 成 员 对 象 c 是 一 个 常量 


Struct Object obj = { 10, 20, 30 }; 
obj.a += obj.b; // 这 条 语句 没有 问题 
// 以 下 这 条 语句 将 会 出 现 编译 报错 ， 

A 因为 0bject 结 构 体 中 的 成 员 对 象 c 是 常量 ， 所 以 它 的 值 不 能 被 修改 
obj.c += 10; 


代码 清单 12-1 人 简单 地 介绍 了 const 修 饰 一 个 普通 类 型 的 对 象 的 使 用 
情景 。 这 里 很 明确 地 描述 了 当 const 修 饰 一 个 复合 类 型 时 的 特性 。 


下 面 我 们 将 描述 const 修 饰 数 组 元 素 的 情况 。 


12.1.2 const 限 定 符 修 饰 数组 元 素 


在 C 语 言 中 ， 一 个 数组 对 象 仅仅 表征 了 对 一 个 连续 存储 空间 的 引 
用 ， 所 以 在 C 语 言 实 现 中 ， 一 个 数组 对 象 的 地 址 与 其 起 始 元 素 的 首 地 
址 都 是 同一 个 地 址 ， 并 且 一 个 数组 对 象 本 身 不 具有 “ 值 ”这 个 概念 。 因 
此 ， 任 一 限定 符 都 不 能 用 于 修饰 一 个 数组 对 象 ， 而 只 能 用 于 修饰 数组 
对 象 的 元 素 。 


代码 清单 12-2 展 示 了 const 修 饰 数组 元 素 的 方式 以 及 效果 。 


代码 清单 12-2 ”const 修 饰 数 组 对 象 元 素 


#include <stdio.h> 
int main(int argc, const char* argv[]) 
// 声明 了 一 个 带 有 5 个 const int 类 型 元 素 的 数组 对 象 a 


// 这 里 的 const 修 饰 的 是 a[i] ， 而 不 是 a 自身 
int const a[] = { 1, 2, 3, 4, 5 } 


卫 二 


F 


// 以 下 这 条 语句 将 产生 编译 错误 ， 
// 因为 数组 对 象 a 中 的 每 个 元 素 都 是 常量 ， 不 能 被 修改 
a[9]++/ 


// 这 里 首先 定义 了 一 个 匿名 枚 举 ， 然 后 用 该 枚 举 类 型 声明 了 一 个 

// 带 有 3 个 常量 元 素 的 数组 对 象 e。e 的 每 个 元 素 类 型 为 const 枚 举 类 型 ， 
// 这 里 的 const 也 能 放 在 enum 之 前 

enum { MY_ENUM1, MY_ENUM2, MY_ENUM3 } 

const e[] = { MY_ENUM1, MY_ENUM2, MY_ENUM3 }; 


e[1] = MY_ENUM3; // 这 条 语句 也 是 无 法 通过 编译 的 


// 这 里 定义 了 一 个 UN 联合 体 类 型 ， 该 类 型 声明 了 一 个 带 有 2 个 常量 元 素 的 数组 对 象 u。 
// u 的 每 个 元 素 的 类 型 为 const union UN， 这 里 的 const 也 能 放 在 union 之 前 。 

union UN { int a; float f; } 
const u[] = { {.a = 10}, {.f = 2.5f} }; 


u[1].f = 0.0f， // 这 条 语句 也 无 法 通过 编译 


printf("The value is: %.1f\n", a[0] + e[1] + u[1].f); 


通过 代码 清单 12-2 的 例子 我 们 可 以 看 到 ，const 修 饰 一 个 数组 对 象 
时 ， 产 生 作用 的 是 该 数组 中 的 每 个 元 素 。 然 而 ， 对 于 像 代码 清单 12-2 
中 数组 对 象 的 类 型 ， 它 仍然 被 表达 为 const int[5]， 表 示 具 有 5 个 const 
int 类 型 元 素 的 数组 。 我 们 要 查看 上 壕 数 组 对 象 类 型 的 话 其 实 非 常 方 
便 ， 比 如 我 们 要 查看 数组 对 象 的 类 型 ， 我 们 在 声明 数组 对 象 a 语句 下 
面 写 一 句 : at+; 。 然 后 ， 编 译 絮 会 提示 编译 出 错 信息 一 一 Cannot 
increment value of type'const int[5]， 这 就 说 明 数 组 对 象 a 的 类 型 为 const 
int[5] 了 。 


下 面 我 们 将 描述 const 所 使 用 的 最 复杂 的 情景 一 与 指针 类 型 混 
用 。 


12.1.3 _ const 限定 符 修 师 指 针 类 型 对 象 


在 C 语 言 中 ， 限 定 符 修饰 一 个 对 象 是 一 个 非常 神奇 的 设 定 ， 这 种 
神 否 不 亚 于 指 癌 数组 的 指针 与 指 癌 函 数 的 指针 这 种 表达 形式 。 我 们 之 
前 已 经 描述 了 const 修 饰 一 个 普通 对 象 的 例子 ， 比 如 一 一 const int 
a=10; 表示 将 对 象 a 指定 为 一 个 常量 ， 对 和 象 a 的 类 型 为 const int。 而 且 这 
里 const 与 int 之 间 的 位 置 可 以 互 换 ， 不 影响 语义 。 而 当 const 要 修饰 一 个 
指针 类 型 的 对 象 时 ， 内 容 束 丰富 了 。 这 里 涉及 一 个 问题 ， 我 们 需要 指 
定 征 将 指针 对 象 本 号 指定 为 钊 量 还 是 将 该 指针 对 象 做 了 间接 操作 之 后 
的 值 作为 彰 量 ， 或 是 将 两 者 同时 作为 常量 。 下 面 我 们 将 分 别 列 出 这 三 
种 表达 方式 。 


int * const pl; // 指定 指针 对 象 p1 为 常量 
int const * p2; // 指定 指针 对 象 p2 做 间接 操作 后 的 值 作为 常量 
int const * const p3; // 指定 指针 对 象 p3 为 常量 ， 对 它 做 间接 引用 后 的 值 也 作为 常量 


我 们 先 对 比 看 一 下 上 述 代 码 片 段 中 的 p1 对 象 。 这 里 const 修 饰 的 古 
p1 指 针对 象 ， 说 明 p1 指 针对 象 目 喘 古 一 个 常量 ， 这 意味 着 p1 一 旦 被 声 
明 ， 它 的 值 束 不 允许 被 修改 ， 比 如 : p1=NULL; 这 条 语句 束 古 错误 
的 。 也 就 是 说 它 不 能 指向 其 他 地 址 ， 但 是 对 *p1 可 以 做 修改 ， 比 如 : 
*p1=20; 这 完全 可 行 。 我 们 看 到 ， 修 饰 p1 指 针对 象 的 const 紧 靠 在 p1 对 
象 标识 符 之 前 ( 即 在 p1 的 左 侧 位 置 ， ， 并 且 在 * 号 之 后 ( 即 在 * 的 右 侧 
位 置 ) ， 此 时 p1 的 类 型 为 int*const 。 


p2 指 针对 象 不 是 一 个 常量 ，const 修 饰 的 是 (*p2) ， 说 明 对 p2 做 
间接 操作 后 ， 其 值 为 一 个 常量， 不 允许 对 它 进 行 修改 。 也 就 是 说 ， 像 
p2=NULL; 这 条 语句 是 完全 有 效 的 ， 而 像 *p2=10; 这 条 语句 则 是 非法 
的 。p2 对 和 象 的 类 型 为 const int*。 


p3 指 针对 象 是 一 个 常量 ， 并 且 对 它 做 间接 控 作 后 的 值 也 是 一 个 常 
量 。 这 意味 着 ， 像 p3=NULL; 以 及 *p3=10; 这 些 都 是 非法 的 。p3 指 针 
对 象 的 类 型 为 const int*const 。 


通过 上 述 三 个 指针 对 象 的 不 同 例子 ， 我 们 可 以 发 现 const 限 定 符 在 
修饰 一 个 指针 对 象 时 所 产生 的 丰富 多 样 性 。 这 里 大 家 要 记 住 的 是 ， 在 
声明 一 个 指针 对 象 时 ， 当 const 限 定 符 摆 放 在 所 有 * 号 的 后 面 、 紧 靠 在 
对 象 标识 符 之 前 ， 那 么 该 const 限 定 符 修 饰 的 是 指针 对 象 本 喘 ， 即 指针 
对 象 不 能 指 癌 其 他 任何 对 象 ， 它 的 值 不 能 被 修改 。 当 const 摆 放 在 最 靠 
近 对 和 象 标 识 符 的 * 号 之 前 时 ，const 修 饰 的 实际 上 是 * 连 同 其 后 面 的 对 象 
标识 答 ， 就 比如 (*p) 的 值 ， 也 就 是 说 对 部 的 值 不 能 进行 修改 。 


所 以 从 const 所 修饰 的 对 象 来 看 ， 我 们 就 可 以 看 它 后 面 的 * 号 位 
置 。 如 果 它 后 面 没有 * 号 ， 那 么 修饰 的 就 是 对 象 本 身 ， 否 则 它 修 饰 的 就 
是 所 有 在 此 对 象 标 识 符 之 前 、const 之 后 的 * 做 间接 操作 之 后 的 对 象 
值 。 像 const int**pp; 这 里 pp 与 (*pp) 都 不 是 常量 ,只 有 (**pp) 才 


日 1 小 屋 。 


征 吊 量 


除了 从 const 所 修饰 对 象 的 标识 符 这 个 视角 看 之 外 ， 还 能 通过 const 
修饰 的 类 型 来 看 。 


比如 : pl 是 int*const 类 型 ， 我 们 看 const 前 面 的 类 型 ， 这 里 是 int*， 
所 以 很 显然 这 里 的 int* 类 型 的 对 象 是 常量 ， 不 可 被 修改 ， 也 就 是 p1 对 
象 目 刁 ， 因 为 p1 的 类 型 去 除 限 定 符 之 后 就 是 int* 类 型 。 所 以 从 类 型 角 
度 看 的 话 束 是 要 看 const 之 前 的 类 型 。 


然后 我 们 看 p2 的 类 型 ， 它 是 const int*， 我 们 不 妨 把 const 与 int 交 换 
一 下 位 置 ， 这 里 的 交换 是 不 会 影响 语义 的 ， 只 要 不 涉及 越过 * 号 的 交 
换 。 我 们 看 到 p2 的 类 型 可 描述 为 int const* ， 我 们 看 摆 放 在 const 前 面 的 
类 型 是 int， 所 以 这 里 对 于 p2 对 象 而 言 ， \*p2) 是 一 个 常量 ， 它 是 


const int 类 型 。 


这 么 一 来 ， 当 我 们 要 声明 一 个 指针 对 象 ， 它 目 映 是 一 个 常量 还 是 
说 对 它 做 间接 操作 之 后 的 对 象 是 一 个 常量 束 有 两 种 方式 去 判别 了 。 当 
然 ， 一般 我 们 用 这 种 类 型 判别 作为 一 种 验证 方式 ， 我 们 在 思考 时 还 是 
自选 上 一 段 所 描述 的 const 限 定 哪 个 对 象 的 方法 ， 不 过 主要 还 在 于 目 己 
皇 么 思考 和 理解 ， 而 不 用 去 强求 采用 哪 种 方式 。 当 我 们 确定 了 * 相 对 于 
const 的 位 置 之 后 也 就 能 确定 当前 的 const 修 饰 的 是 哪 种 类 型 一 一 const 修 
饰 的 是 跟 在 它 后 面 的 连同 * 包 含 在 一 起 的 那个 对 象 。 像 对 于 p1 来 说 ， 
const 后 面 束 是 p1， 所 以 此 时 const 修 饰 的 就 是 p1 对 象 ， 而 p1 对 象 的 类 型 
就 是 intsconst; 对 于 p2，const 后 面 跟 的 是 *p2， 所 以 const 修 饰 的 束 是 


(*p2) ， 而 (*p2) 的 类 型 很 显然 束 是 const int， 对 于 p3 则 有 两 个 
const， 最 前 面 的 const 后 面 跟 着 的 是 (*const p3) ， 所 以 (*p3) 就 是 
常量 类 型 ， 即 const int;， 而 后 一 个 const 紧 贴 着 p3， 说 明 它 修饰 的 就 是 p3 
对 和 象 ， 所 以 p3 目 映 束 是 一 个 常量 ， 这 人 么 一 来 ，p3 的 类 型 束 是 const 
int*const。 这 里 我 们 可 以 发 现 ， 当 对 一 个 对 象 做 一 次 间接 操作 之 后 ， 
比如 (*p3) ， 其 类 型 就 看 该 * 之 前 的 部 分 ， 而 * 之 后 的 所 有 限定 符 都 可 
以 直接 无 视 ， 所 以 (*p3) 的 类 型 束 是 const int，* 后 面 的 const 可 以 无 视 
之 。 而 p3 类 型 则 需要 把 所 有 的 const 限 定 符 都 市 上 。 


男 外 ， 我 们 还 能 观察 到 这 么 一 个 用 来 判定 当前 对 象 的 值 是 否 可 修 
改 的 规律 : 如 采 当 前 对 象 标识 符 的 前 面 紧 贴 着 const， 那 么 该 对 象 的 值 
无 法 修改 ， 如 采 前 面 紧 贴 厦 的 是 *， 那 么 该 指针 对 象 的 值 则 可 修改 。 比 
如 pl 之 前 紧 贴 厦 const， 所 以 p1 的 值 无 法 被 修改 ;而 p2 之 前 紧 贴 着 的 是 
*， 所 以 p2 可 被 修改 ， 但 是 (*p2) 前 面 就 紧 贴 着 const 了 ， 所 以 

(*p2) 的 值 就 不 能 被 修改 了 。 


当 我 们 掌握 了 这 些 识别 const 如 何 修饰 指针 对 象 的 技巧 之 后 ， 我 们 
可 以 来 点 更 复杂 的 情况 。 请 见 代 码 清 单 12-3。 


代码 请 单 12-3 ”const 修 饰 指针 对 和 象 的 绪 合 情况 


#include <stdio.h> 


// 这 里 定义 了 一 个 dummy 画 数 ， 稍 后 会 用 至 
static void dummy(int a) 


di 


printf("param a = %d\n", a); 


} 


int main(int argc, const char* argv[]) 


// 声明 一 个 常量 对 象 a， 并 将 它 初始 化 为 19 
const int a = 10; 


// 声明 一 个 普通 对 象 b， 并 将 它 初始 化 位 20 


int b = 20; 

// 声明 一 个 变量 指针 对 象 p， 对 象 a 的 地 址 对 它 初 始 化 

int const *p = &a; // p 的 类 型 为 const int * 

*p = 20; // 这 句 非法 ! (*p) 是 一 个 常量 ， 其 值 不 能 被 修改 

p = &b; // 这 何 没 问 是 

// 声明 了 一 个 常量 人 对 象 b 的 地 址 对 其 初始 化 

int * const q = &b LY q 的 类 型 为 int * const 

q = NULL; // 这 人 句 非 法 ! q 是 一 个 常量 ， 其 值 不 能 被 修改 

“q += 10; // 这 句 没 问题 

// 这 里 声明 了 一 个 变 生 指针 对 象 cpp， 用 指针 对 象 p 的 地 址 对 它 初始 化 ， 

// 注意 ， 这 里 的 const 修 人 饰 的 是 (**cpp)， 只 有 (**cpp) 不 能 被 修改 。 

// 此 外 ， 这 里 (*cpp) 的 类 型 为 const int *，(*xcpp) 的 类 型 为 const int 

int const **cpp = &p; // pp 的 闫 超 为 consf Tnt ** 

*cpp = &a; // 这 里 通过 间接 操作 ， 使 得 指针 对 象 p 又 指向 了 a 

if(p == &a) 

puts("p points to a!"); 

cpp = NULL; // 这 名 没有 问题 
**cpp = 0; // 这 句 错 误 ! 因为 (**cpp) 是 一 个 常量 ， 其 值 不 允 六 
被 修改 

// 这 里 声明 ] 个 常量 指针 对 象 cqq， re 址 对 它 初始 化 。 

// cqq 前 的 const 修 饰 的 是 cqq， 说 明 cqq 个 常量 

// int* 后 面 的 const 修 饰 的 是 (*cqq)， 说 明 (* *cqq) 也 是 一 个 常量 。 

// 也 就 是 说 ， 这 里 (*cqq) 的 类 型 为 int * const，(**cqq) 的 类 型 为 int 

int* const * const cqq = &q; // cqq 的 类 型 为 int * const * const 

**Cqq += 100; // 这 名 没有 问题 ，(**cqdq ) 的 类 型 是 int， 不 是 一 个 常量 

printf("b = %d\n", b); 

*cqq = NULL; // 这 句 错误 ! (*cqq) 的 类 型 为 int * const， 是 一 个 常量 

cqq = NULL // 这 句 错误 ! cqq 的 类 型 为 int * const * const， 是 一 个 常量 


// 声明 一 个 数组 对 象 arr， 它 含有 3 个 int 类 型 的 元 素 
int arr[3] = { 1, 2, 3 }; 


// 这 里 声明 了 一 个 常量 指针 对 象 pArray， 指 向 数组 对 象 arr 的 地 址 ， 

// pArray 的 类 型 为 int (* const)[3], const 修 饰 的 是 pArray 对 | 象 标识 符 ， 
// 这 也 说 明 const 修 和 币 的 类 型 为 nt (* )[3]， 即 pArray 自 身 是 一 个 常 是 
int (* const pArray)[3] = &arr,; 

(*pArray)[1] = 0;  // 0K, 没有 问题 

pArray = NULL; // 这 句 话 则 是 非法 的 ，pArray 是 常量 ， 其 值 不 允许 被 修改 
printf("arr[1] = %d\n", arr[1]); 


// 这 里 声明 了 一 个 指向 画 数 的 指针 常量 对 象 pFunc。 ， | 
// 这 里 的 const 修 饰 的 是 pFunc 标 识 符 ， 说 明 pFunc 自 身 是 一 个 常量 。 
// const 所 修饰 的 类 型 则 是 void (*)(int) 


void (* const pFunc)(int) = &dummy; 


pFunc(100); // 没 问题 
pFunc = NULL; // 语法 错误 ! pFunc 是 常量 ， 其 值 不 允许 被 修改 


代码 清单 12-3 中 也 体现 了 如 何 去 判 定 一 个 指针 对 象 的 音量 情况 。 
正如 之 前 提 到 的 ， 对 于 从 const 修 饰 哪个 对 象 而 言 则 十 看 const 后 面 的 * 
号 情况 。 我 们 把 const 后 面 的 * 号 连同 对 象 标 识 符 一 起 放 进 去 看 ， 比 如 
像 对 和 象 p， 它 的 声明 符 中 const 后 面 有 一 个 * 号 ， 那 么 这 个 const 束 修饰 了 
整个 (*p) ， 说明 (*p) 是 一 个 常量 。 而 对 于 指针 对 象 g，const 后 面 
就 只 有 一 个 对 象 标识 符 q9， 说 明 const 修 饰 的 就 是 q 本 身 ， 那 么 q 就 是 一 


个 常量 ， 而 (*q) 则 不 是 常量 。 


对 于 一 个 指针 对 象 被 多 个 const 修 岳 的 情况 我 们 也 无 需 慨 张 ， 我 们 
可 以 从 石 往 左 看 各 个 const 修 饰 的 对 象 是 哈 。 当 我 们 在 看 某 个 const 修 饰 
哪个 对 象 时 可 把 其 余 的 const 全 都 忽略 。 比 如 我 们 看 代码 清单 12-3 中 的 
cqdq 这 个 比较 复杂 的 指针 对 象 ， 首 先 在 cqq 之 前 有 一 个 const 限 定 符 ， 说 
明 这 个 const 修 饰 的 就 是 cqq 自 身 。 而 对 于 int* 后 面 的 那个 const， 我 们 从 
这 个 const 位 置 起 从 左 往 右 看 ， 可 以 看 到 const 后 面 跟着 的 是 *const cqq 。 
正如 之 前 所 说 的 ， 我 们 把 * 之 后 的 const 都 忽略 掉 可 得 到 : *cqq， 说 明 
这 里 * 之 前 的 const 修 饰 的 是 (*cqq) ， 这 意味 着 (*cqq) 的 值 不 允许 被 
修改 。 而 对 于 (**cqq) ， 由 于 最 左边 的 * 前 面 没 有 const 修 饰 ， 所 以 它 
不 是 常量 ， (**cqq) 的 值 可 以 被 修改 。 


代码 清单 12-3 也 摘 述 了 对 于 指 回 数组 的 指针 对 象 以 及 指 回 函数 的 
指针 对 象 如 何 用 const 修 饰 。 其 实 原 理 也 一 样 ， 直 接 在 指针 对 象 标识 符 
前 添加 const 即 可 。 


以 上 讲 的 是 const 如 何 修饰 一 个 指针 对 象 的 问题 ， 而 对 于 整个 C 语 

言 类 型 系统 而 言 还 有 一 个 比较 重要 的 问题 是 一 一 如 何 匹配 一 个 含有 
const 修 饰 的 对 象 类 型 。 这 里 除了 涉及 C 语 言 的 类 型 系统 之 外 ， 还 涉及 
一 个 类 型 安全 问题 。 比 如 说 ， 我 们 声明 了 一 个 常量 对 象 const int 
a=10; ， 如 果 用 它 赋值 给 另 一 个 普通 变量 对 象 ， 这 是 完全 没有 问题 
的 ， 比 如 : int b=a; 。 因 为 无 论 变 量 b 如 何 修改 其 值 ， 常 量 a 的 值 是 不 
会 受到 影响 的 。 但 如 果 用 一 般 的 指针 对 象 (如 int*p=&a; ) 去 指向 某 
个 常量 对 象 会 发 生 什么 呢 ? 当 我 们 对 指针 对 象 p 采 用 间接 操作 符 来 修改 
值 的 时 候 ， 比 如 *p=20; 此 时 对 象 a 的 值 就 被 改变 了 ， 这 和 与 对 象 a 作 为 常 
量 这 一 属性 是 相 违 背 的 。 所 以 在 C 语 言 中 ， 对 一 个 常量 对 象 做 取 地 址 
操作 之 后 的 指针 类 型 是 在 const 后 面 直 接 加 * 号 。 比 如 对 于 “const type 
obj; ”，&obj 的 类 型 就 是 const type*。 这 么 做 可 使 得 对 该 指针 类 型 做 间 
接 操 作 之 后 仍然 保持 常量 类 型 。 所 以 像 上 面 的 const int a; &a 的 类 型 为 
const int*， 当 然 表示 为 int const* 则 更 容易 做 类 型 判定 。 而 一 个 const 
int* 类 型 的 指针 对 象 是 不 能 赋值 给 一 个 int* 类 型 的 指针 对 象 的 ， 除 非 用 
投射 操作 做 类 型 强制 转换 。 我 们 在 判定 一 个 对 象 取 其 地 址 之 后 的 类 型 
的 方法 也 很 简单 一 一 直接 将 原本 对 象 的 标识 符 变 为 * 号 即 可 。 比 如 ， 这 
里 的 a 声明 为 const int a， 那 么 取 其 地 址 之 后 ，&a 的 类 型 则 是 const int* 

(把 a 变 成 了 *) 。 而 对 于 代码 清单 12-3 中 的 qg， 它 声明 为 int*const q， 
那么 取 其 地 址 之 后 ，&q 的 类 型 为 int*const* (把 q 变 成 了 *) 。 


正 由 于 存在 类 型 安全 问题 ， 所 以 等 号 操作 符 的 左边 表达 式 的 类 型 
如 何 去 匹 配 等 号 操作 符 右 边 表达 式 的 类 型 有 一 定 学 问 。 正 如 上 一 段 所 
述 ， 等 号 操作 符 右 边 的 const int* 类 型 不 能 隐 式 转换 为 等 号 操作 符 左边 
的 int* 类 型 ， 然 而 ， 等 号 操作 符 右 边 如 末 是 int* 类 型 ， 那 么 可 以 隐 式 转 
换 为 const int* 类 型 与 等 号 操作 符 左 边 的 表达 式 匹 配 。 换 句 话 说 ， 低 限 
定 的 类 型 可 以 隐 式 转 为 高 限定 类 型 ， 而 高 限定 类 型 则 不 允许 隐 式 转 为 
低 限 定 类 型 。 除 了 这 种 情况 一 一 int** 不 能 隐 式 转换 为 const int** 类 型 。 
代码 清单 12-4 给 出 了 int** 不 能 隐 式 转换 为 const int** 的 理由 。 


代码 清单 12-4 ”展示 const int** 如 何 巧 妙 地 修改 了 一 个 利 量 对 象 的 
值 


#include <stdio.h> 


int main(int argc, const char* argv[]) 


// 这 里 先 声明 一 个 常量 对 象 a 
const int a = 10; 


// 这 里 声明 一 个 普通 指针 对 象 p， 初 始 化 为 空 
int *p = NULL 


// 这 里 声明 一 个 const int** 的 指针 对 象 pp， 指 向 p 的 首 地 址 。 
// 这 里 用 投射 操作 做 类 型 强制 转换 就 是 因为 ， 

// intx* 不 能 隐 式 转换 为 const int ** 类 型 。 

const int **pp = (const int**)e&p; 


i 


// 这 里 大 家 注 pp 的 类 型 是 const ns 
// 的 类 站 全 是 Cnet Cn 所 以 两 者 完全 兼 
// 这 条 语句 执行 之 后 ，p 也 就 被 间接 指向 了 党 量 对 象 a 的 地 址 
*pp = 一 &a; 


if(p == &a) 
puts("p points to a!"); 


// 最 后 通过 指针 对 象 p 来 间接 修改 常量 对 象 a 的 值 
*p = 10; 


printf("a = %d\n", a); 


从 代码 清单 12-4 中 可 以 看 到 ， 倘 奉 int** 能 隐 式 园 换 为 const int**， 
那么 我 们 通过 一 个 中 间 普 通 指 针对 象 瑟 能 绕 过 原先 常量 对 和 象 的 访问 权 
限 ， 从 而 间接 修改 首 量 对 象 值 的 情况 。 这 里 ， 最 具 破 坏 力 的 语句 就 是 
一 一 *pp=&a; 。 由 于 a 是 一 个 常量 对 象 ， 而 (*pp) 的 类 型 为 const 
int*， 完 全 与 &a 的 类 型 相同 ， 所 以 这 个 赋值 没有 任何 问题 ,但 所 呈现 
的 问题 则 是 这 条 间接 操作 赋值 语句 把 常量 对 象 的 地 址 传递 给 了 普通 指 
问 对 象 p。 随 后 ， 普 通 指针 对 象 p 可 以 通过 间接 操作 即 可 随意 修改 帝 量 
对 象 a 的 值 。 


因此 ， 在 C 语 言 中 不 允许 直接 将 int** 隐 式 转换 为 const int**， 而 只 
能 将 int** 隐 式 转换 为 const int*const* 类 型 。 如 果 代 码 清 单 12-4 中 的 指针 
对 和 象 pp 的 类 型 是 const int*const*， 那 么 当 对 pp 做 第 一 次 间接 操作 时 ， 
(*pp) 的 类 型 为 int const*const， 其 值 不 允许 被 修改 ， 从 而 保证 了 无 法 
通过 (*pp) 将 原先 初始 化 时 指向 的 指针 对 和 象 间接 地 将 它 修 改 为 指向 某 
个 常量 对 象 。 


以 上 已 经 基本 把 const 限 定 符 如 何 修饰 一 个 对 象 以 及 修饰 后 所 产生 
的 效果 部 详细 描述 了 。 各 位 在 看 完 这 些 内 容 后 务必 要 反复 实践 ， 这 样 
才能 加 深 对 限定 符 的 了 解 ， 这 块 内 容 也 确实 不 容易 掌握 。 


12.1.4 const 限定 符 修饰 函数 形 参 类 型 为 数组 的 
对 象 


下 面 再 谈 一 下 const 限 定 符 如 何 修饰 函数 形 参 为 数组 类 型 的 场合 。 
我 们 在 9.3 节 中 已 经 谈 过 ， 一 个 函数 的 形 参 可 以 被 表达 为 一 个 数组 类 
型 ， 但 它 本 质 上 仍然 是 一 个 指针 ， 既 然 是 一 个 指针 ， 那 么 它 跟 原生 的 
数组 对 象 束 会 有 所 不 同 。 前 面 讲 了 ， 原 生 的 数组 对 象 本 里 是 不 可 被 修 
改 的 ， 因 此 没有 所 谓 的 用 限定 符 修饰 数组 对 象 的 这 个 概念 ， 然 而 对 于 
旨 针 则 不 同 ， 指 针对 象 的 值 是 可 被 修改 的 。 如 采 我 们 要 对 以 数组 类 型 
呈现 的 函数 形 参 对 象 施 加 const 限 定 ， 使 得 该 形 参 值 无 法 被 修改 ， 那 么 
我 们 只 需要 将 const 限 定 符 放置 在 D] 下 标 操作 符 里 面 即 可 。 如 有 果 [] 中 含有 
数值 字面 量 或 其 他 标识 符 ， 那 么 const 放 在 它们 的 前 面 ， 即 左 侧 位 置 。 
代码 清单 12-5 展 示 了 const 修 饰 函 数 形 参 为 数组 类 型 的 例子 。 


代码 请 单 12-5 const 修饰 函数 形 参 为 数组 类 型 的 例子 


#include <stdio.h> 


// 这 里 ， 形 参 a 相当 于 int * const 类 型 
// 形 参 b 相 当 于 const int * 类 型 
// 形 参 c 相 当 于 int const * const 类 型 
static void Fun(int a[lconst 5], const int b[3], 
const int c[static const 4]) 


a[O]++; // OK! 没有 问题 

a = NULL; // 错误 ! a 是 一 个 常量 指针 对 象 

b[OJ]++; // 错误 ! b[9] 是 const int 类 型 ， 一 个 常量 
c[O]++; // 错误 ! c[0] 是 const int 类 型 ， 是 一 个 常量 


c = NULL; // 错误 ! c 本 身 是 一 个 常量 ， 不 能 被 修改 


printf("The Sum is: %dxn"，a[0] + b[1] + c[2]); 


b = NULL; // OK! 没有 问题 


int main(int argc, const char* argv[]) 


int a[] = { 1, 2, 3, 4, 5 }; 
int b[] = {7, 8, 9 }; 
int c[] = { 10, 11, 12, 13 }; 


Fun(a, b, c); 


代码 清单 12-5 中 给 出 了 3 种 不 同类 型 的 形 参 ， 我 们 看 每 个 形 参 的 本 
质 类 型 时 也 非常 简单 ， 直 接 将 [去掉 ， 把 里 面 的 static 等 存储 类 说 明 符 
也 全 都 去 掉 ， 只 留 限 定 符 ， 然 后 把 标识 符 变 为 * 号 即 可 。 另 外 ， 如 采 我 
们 对 使 用 数组 下 标 操作 符 的 对 和 象 类 型 是 否 为 一 个 常量 看 不 清 ， 可 以 把 
数组 下 标 形式 变 为 间接 操作 形式 ， 比 如 a[0]++; 可 以 转换 为 (* 
(a+0) ) ++; ， 语 义 是 相同 的 ， 这 样 我 们 就 能 看 到 a[0] 的 类 型 其 实 与 
(*a) 一 样 ， 都 是 int 类 型 ， 而 这 里 const 修 饰 的 是 a 上 自身 。 


12.1.5 ”类 型 限定 符 的 本 质 含 义 


最 后 ， 我 们 来 描述 一 下 类 型 限定 符 的 本 质 含 义 。 所 谓 类 型 限定 符 
很 显然 ， 它 主要 是 限定 类 型 的 ， 尽 管 在 文法 上 它 也 可 以 看 作 修 饰 一 个 
对 象 ， 而 像 我 们 上 面 那 种 const 限 定 的 判定 主要 是 以 对 和 象 作为 参照 的 ， 
这 里 我 们 将 再 详细 介绍 如 何 根据 类 型 进行 判定 。 类 型 限定 符 所 限定 的 
是 类 型 说 明 符 (比如 基本 类 型 ， 枚 举 、 结 构 体 、 联 合体 等 用 户 自 定义 
类 型 ， 还 有 稍 后 会 讲 的 原子 类 型 说 明 符 ) ， 以 及 与 类 型 说 明 符 相 结合 


的 指针 类 型 。 我 们 假定 有 某 个 含有 N 级 指针 的 类 型 Type 《Type 自身 或 
许 也 包含 着 const 限 定 符 ) ， 那 么 Type const 或 者 const Type 都 表示 类 型 
Type 受到 const 限 定 。 然 而 在 C 语 言 中 ， 我 们 只 能 通过 typedef 将 整个 类 
型 组 合 为 一 个 类 型 标识 符 Type， 这 一 点 会 在 下 一 章 描 述 。 而 像 const 
int* 这 个 类 型 ，int* 没 有 被 视 为 一 个 整体 ， 这 里 的 const 限 定 的 仅仅 是 int 
类 型 ， 而 不 是 整个 int* 类 型 。 所 以 ， 在 C 语 言 中 使 用 限定 符 后 置 法 ， 将 
int*const 这 种 写法 看 作为 const 限 定 int* 类 型 。 因 此 我 们 碰 到 除 _Atomic 
之 外 的 类 型 限定 符 ， 都 看 整个 类 型 声明 的 最 右边 的 限定 符 ， 最 右边 的 
限定 符 限 定 了 在 它 左 边 的 所 有 类 型 。 如 果 对 当前 对 象 做 了 N 次 间接 操 
作 ， 那 么 我 们 就 从 右 往 左 跳 过 N 个 * 号 ， 看 类 型 限定 符 限 定 的 情况 。 


像 代码 清单 12-5 中 的 Fun 范 数 形 参 对 象 4， 已 知 其 类 型 为 int*const， 
那么 对 于 a 目 映 来 说 ， 其 类 型 最 右边 有 一 个 const， 那 很 显然 ， 它 就 十 
一 个 常量 ， 而 对 于 (*a) 或 al0] 而 言 ， 我 们 用 了 一 次 间接 操作 符 ， 那 
么 我 们 从 右 往 左 看 跳 过 一 个 * 号 ， 前 面 有 没有 const， 说 明 (*a) 的 类 
型 束 是 int， 不 是 一 个 和 常量。 同样 ， 我 们 再 分 析 一 下 形 参 对 象 c， 它 的 类 
型 可 以 通过 上 述 方式 解析 出 来 ， 是 一 个 int const*const 类 型 。 那 么 对 于 c 
而 言 ， 它 前 面 就 有 一 个 const， 所 以 c 就 是 一 个 常量 ， 而 对 于 (*c) 或 
c[0] 而 言 ， 做 了 一 次 间接 操作 之 后 看 第 一 个 * 前 面 是 否 跟着 一 个 const， 
我 们 看 到 确实 有 一 个 const， 所 以 (*c) 也 是 一 个 常量 ， 其 类 型 为 const 


int ° 


我 们 可 以 再 引申 ， 观 察 代码 清单 12-3 中 的 cpp 和 cqq。cpp 指 针对 象 
的 类 型 为 int const**， 那 么 对 于 cpp 而 言 ， 类 型 最 右边 是 一 个 * 号 而 没有 
位 到 const， 所 以 cpp 本 身 不 是 一 个 常量 ， 而 (*cpp) 做 了 一 次 间接 操作 
之 后 ， 跳 过 最 右边 的 * 号 ， 其 类 型 为 int const*。 很 显然 ， 这 个 类 型 的 最 
右边 也 是 一 个 * 号 而 不 存在 const， 所 以 (*cpp) 也 不 是 一 个 常量 ， 最 
后 再 看 (**cpp) ， 做 了 第 二 次 间接 引用 之 后 ， 其 类 型 为 int const， 这 
里 很 明显 就 有 一 个 const， 所 以 (**cpp) 是 一 个 常量 。 而 cqq 也 同样 分 
析 ，cqq 的 类 型 为 int*const*const， 它 前 面 就 有 一 个 const， 所 以 cqq 自 身 
是 一 个 常量 ， 而 做 了 第 一 次 间接 操作 之 后 ， (*cqq) 的 类 型 为 
intxconst， 很 显然 最 右边 是 一 个 const， 所 以 (*cqq) 也 是 一 个 常量 ; 
最 后 看 做 第 二 次 间接 操作 之 后 ， (**cqq) 的 类 型 ， 它 是 int， 没 有 


const 修 饰 ， 所 以 (**cqq) 不 是 一 个 常量 。 


由 于 像 const 以 及 volatile 类 型 限定 符 在 C90 标 准 中 束 已 经 3| 入 了 ， 
所 以 对 于 类 型 的 限定 看 上 去 有 些 别扭 。 但 这 种 表达 方式 也 是 相当 完备 
的 ， 能 适用 于 任何 类 型 组 合 ， 这 也 是 C 语 言 从 标准 化 开始 起 就 注定 要 
贯彻 设计 为 一 门 简 涪 、 灵 活 且 强大 的 编程 语言 这 一 目标 。 


12.2 volatile 限 定 符 


volatile 在 英语 中 的 意思 是 “不 稳定 的 ”,“ 易 变 的 ",，“ 易 挥发 的 ”。C 
语言 用 volatile 限 定 符 修饰 一 个 对 象 时 ， 指 明 该 对 象 的 值 可 能 会 被 异步 
修改 ， 这 暗示 了 编译 右 不 要 对 该 对 象 做 寄存 器 暂 存 优化 ， 在 读 写 它 的 
时 候 总 需要 显 式 地 从 它 的 存储 器 地 址 中 获取 值 。 一 般 而 言 ，C 语 言 实 
现 会 将 一 个 函数 中 多 次 出 现 的 同一 对 象 的 值 尽 可 能 地 存放 在 寄存 大 
中 ， 如 果 该 对 象 的 内 容 可 以 存放 在 寄存 器 中 (不 超过 一 个 寄存 器 所 能 
容纳 的 字 市 数 ) ， 且 寄存 器 数量 足够 。 毕 竟 ， 寄 存 器 访问 比 读 写 内 存 
要 快 得 多 。 


volatile 一 般 用 于 多 个 线程 所 共享 的 资源 ， 包 括 用 于 数据 同步 的 锁 
对 象 。 另 外 ， 航 入 式 系统 也 会 将 MMR (存储 器 映射 的 寄存 器 ) 地 址 类 
型 定义 为 指向 volatile 的 指针 类 型 。volatile 修 饰 对 象 时 所 摆 放 的 位 置 与 
它 所 起 的 修饰 效果 同 const 一 样 ， 这 里 不 再 资 述 。 此 外 ，volatile 可 以 与 
const 一 同 使 用 ， 尽 管 这 么 做 的 场合 不 多 ， 不 过 对 于 MMR 的 访问 来 说 
倒 也 不 错 一 一 比如 : int data=* (const volatile int*) Oxff800000UL; 表 
示 从 0xff800000 地 址 所 映射 的 外 设 寄存 器 中 获取 int 类 型 的 相关 数据 。 
这 里 使 用 volatile 限 定 符 表示 在 每 次 出 现 * (const volatile int*) 
0xff800000UL 时 ， 都 要 显 式 地 读 取 该 地 址 中 的 内 容 ， 而 不 是 在 第 一 次 


读 取 之 后 束 默 认 将 该 值 存放 在 CPU 的 寄存 器 中 ， 然 后 后 续 的 读 取 都 直 
接 从 该 寄存 器 中 获取 数据 。 


下 面 ， 我 们 将 通过 代码 清单 12-6 来 描述 volatile 限 定 符 的 使 用 以 及 
量 史 


wt 
> 


代码 清单 12-6” ”volatile 的 使 用 及 效果 


#include <stdio.h> 
#include <pthread.h> 


// 这 里 定义 了 一 个 Fun 画 数 ， 其 形 参 a 的 类 型 为 : int * const volatile 
static void Fun(int a[static Volatile const 2]) 


printf("a[0] = %d，a[1] = %d\n", a[0], a[1]); 


// 这 里 先 声 明 一 个 普通 的 int 类 型 静态 对 象 
static int normalInt ， 


// 这 里 声明 了 一 个 volatile 的 ijnt 类 型 静态 对 象 
static volatile int volatileInt,; 


// 这 个 函数 用 于 用 户 线程 执行 例 程 
static void* ThreadProc(void *param) 


// 这 里 的 考察 很 简单 ， 做 一 个 1000000 次 循环 ， 
// ee 递增 ， 
// 最 后 看 主线 程 中 这 两 个 值 的 变化 

for(int i = 0; i < 1000000; i++) 


normalInt++; 
volatileInt++; 


return NULL; 


int main(int argc, const char* argv[]) 


// 在 主线 程 中 ， 始 将 normalInt 与 VolatileInt 初 始 化 为 9 
normalInt = 0; 
volatileInt = 0; 


pthread_t threadID,; 
// 我 们 用 pthread API 创 建 一 个 用 户 线程 ， 
// 该 线程 中 normalInt 与 volatileInt 在 不 断 变化 

pthread_create(&threadID, NULL, &ThreadProc, NULL); 


// 我 们 这 里 就 循环 10000 次 ， 明 显 少 于 用 户 线程 的 1000000 次 ， 
// 这 样 ， 用 户 线程 在 对 这 两 个 考察 对 象 的 最 终 修 改 不 会 做 综合 (synthesize) 
while(volatileIint < 10000); 


// 我 们 在 Release 模 式 下 能 观察 到 ，normalLInt 对 象 的 值 始终 为 0; 
// 而 volatileInt 则 得 到 了 当前 修改 后 的 值 
printf("normalInt = %d\n", normalInt); 
printf("volatileInt = %d\n", volatileInt); 


// 这 里 声明 一 个 指针 对 象 p，(*p ) 的 类 型 为 Volatile int 
volatile int *p = &volatileInt 


// 这 里 声明 了 一 个 指针 对 象 9， 它 自身 是 volatile 的 。 
// (*gq) 的 类 型 则 是 int， 不 是 volat3i1s 的 
int * volatile q = &normalInt ， 


Fun( (int[]){ *p, *q }); 


各 位 在 运行 代码 清单 12-6 中 的 代码 示例 时 必须 注意 ， 一 定 要 将 当 
前 编译 环境 设置 为 Release 模 式 (一 般 开发 环境 默认 的 设置 是 Debug 模 
式 ) ， 只 有 这 样 ， 编 译 器 才 会 对 代码 做 出 优化 ， 我 们 才能 看 到 效果 。 
而 如 果 用 命令 行 编译 的 话 ， 我 们 可 以 直接 用 -O02 命令 选项 ， 并 量 不 添 
加 -g 命 令 选项 即 可 。 另 外 ， 在 Linux 环 境 下 ， 我 们 需要 使 用 --pthread 连 
接 命令 选项 来 连接 pthread 的 安全 实现 运行 时 库 。 而 在 macOS 环 境 下 鸭 
认 已 经 把 底层 的 库 都 连接 好 了 ， 无 需 手 工 设置 。 


12.3 ”restrict 限 定 符 


restrict 限 定 符 是 从 C99 标 准 开始 引入 的 。 它 的 用 法 与 之 前 的 const 
和 volatile 有 所 不 同 ， 它 只 能 用 于 修饰 一 个 指针 类 型 的 对 象 ， 而 不 能 
于 修饰 一 个 普通 对 象 。 通 过 受 restrict 限 定 的 一 个 指针 所 访问 的 一 个 对 
象 与 该 指针 有 具有 一 种 特殊 的 关联 性 。 这 种 关联 性 要 求 ， 对 该 对 象 的 所 
有 访问 都 要 直接 或 间接 使 用 那个 特定 指针 的 值 ， 而 不 受 其 他 指针 的 干 
涉 。 使 用 restrict 限 定 符 可 暗示 编译 堪 对 通过 指针 访问 的 数据 进行 优 
化 ， 比 如 说 我 们 可 以 直接 将 受 restrict 限 定 的 指针 所 读 取 到 的 值 存 放 在 
寄存 髓 中 ， 后 续 再 次 出 现 对 该 指针 的 访问 时 可 直接 拿 寄 存 右 中 的 数 
据 ， 而 不 需要 做 真正 的 访 存 操作 。 


下 面 我 们 通过 代码 清单 12-7 举 一 个 位 单 的 示例 ， 这 样 大 家 束 能 有 
一 定 的 感性 认识 了 。 


代码 清单 12-7 初 舌 restrict 限 定 符 


#include <stdio.h> 
#include <stdint.h> 


int main(int argc, const char* argv[]) 
// 这 里 声明 一 个 数组 ， 它 含有 8 个 uint8_t 类 型 的 元 素 


uint8_t bytes[] = Ox10, Ox20, Ox30, QOx40, 
Ox50, QOx60, QOx70, ox80 }; 


// 声明 一 个 指向 int32_ t 类 型 的 指针 对 象 p， 它 直 接 指向 bytes 数 组 的 首 地 址 
Int32 t *p = (int32_t*)bytes' 

// “p 的 初始 值 为 ex49302910 

printf("First, *p = Ox%.8X\n", *p); 


// 声明 一 个 指向 int32_t 类 型 的 指针 对 象 g， 它 直接 指向 bytes[2] 位 置 元 素 的 地 址 


int32 t *q = (int32_t*)&bytes[2]; 
// *q 的 初始 值 为 0x606504030 
printf("First, *q = Ox%.8X\n", *q); 


*q += 16; 


// 输出 : *p = 0x40402010 
printf("Now, *p = Ox%.8X\n", *p); 


各 位 注意 ， 代 码 清单 12-7 中 的 示例 代码 必须 在 x86 处 理 器 或 
ARMYV7 或 更 高 版 本 的 处 理 右 中 执行 。 各 位 可 以 看 到 ， 代 码 清单 12-7 
中 ， 指 针对 象 p 与 指针 对 象 之 间 是 有 车 加 部 分 的 ， 即 bytes[2] 与 
bytes[3] 部 分 ， 这 两 个 元 素 所 在 的 地 址 分 别 作为 p 所 指 对 象 的 高 2 字 节 以 
及 q 所 指 对 象 的 低 2 字 节 。 这 意味 着 无 论 是 指针 对 象 p 还 是 指针 对 象 q， 
它们 都 不 能 作为 一 个 指 同 独立 对 象 的 指针 ， 也 就 是 说 ， (*p) 与 

(*q) 所 表示 的 对 象 不 是 相互 独立 的 ， 而 是 有 车 交 (aliasing) 的 。 在 
这 种 情况 下 ， 指 针 p 与 指针 q 都 不 能 用 restrict 限 定 符 去 修饰 。 


很 显然 ， 如 果 我 们 这 里 允许 对 (*p) 与 (*q) 的 访问 做 寄存 器 暂 
存 优化 ， 那 么 当 对 (*p) 做 修改 时 ， (*q) 的 低 2 字 节 也 被 改变 ， 而 寄 
存 器 中 的 内 容 却 得 不 到 更 新 ， 同 样 ， 如 采 对 (*q) 做 修改 ， 那 么 

(*p) 的 高 2 字 节 的 值 也 被 修改 ， 而 其 寄存 器 中 的 内 容 也 得 不 到 更 新 ， 
这 会 导致 不 可 预期 的 结果 。 这 也 是 为 何 无 法 对 存储 空间 存在 县 交 的 两 
个 指针 对 象 做 restrict 限 定 的 原因 。 


对 于 一 个 受 restrict 限 定 符 限定 的 指针 对 象 ， 它 所 指向 的 存储 空间 
应 该 在 当前 执行 环境 下 是 唯一 的 ， 没 有 其 他 指针 与 它 指 癌 同一 个 存储 


空间 ， 并 有 旦 也 不 存在 任何 与 其 他 指针 所 指向 的 存储 空间 有 重 舍 的 情 
况 。 代 码 清单 12-8 进 一 步 描述 了 restrict 限 定 符 的 使 用 。 


代码 清单 12-8 restrict 限 定 符 的 进一步 使 用 


#include <stdio.h> 
#include <stdint.h> 


// 这 里 参数 a 的 类 型 为 : int * const volatile restrict 
static void Fun(int a[static const volatile restrict 2]) 


printf("The result is: %d\n", a[0] + a[1]); 


六 
* 下 面 我 们 自制 一 条 利用 restrict 限 定 符 的 存储 数据 拷贝 画 数 
* @param pDst 指向 目的 存储 空间 
* @param pSrc 指向 源 存储 空间 
* @param count 指定 要 渚 册 多 少 个 int32 《的 数据 元 素 
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void MyfastMemCpy(int32 _t* restrict pDst, const int32 t* restrict pSrc, 
size_t count) 
{ 


// 如 果 元 素 个 数 为 偶数 ， 我 们 直接 2 个 元 素 2 个 元 素 进行 拷贝 ， 以 提升 效率 
if((count & 1) == 0) 
{ 


const size t nLoop = count / 2,; 
Uint64 t* restrict p = (uint64 t*)pDst,; 
const uint64 t* restrict q = (const uint64 t*)pSrc; 


for(size_t i = 0; i < nLoop; i++) 
p[i] = qli]; 


else 


for(size t i = 0; i < count; i++) 
pDst[i] = pSrc[i]; 


int main(int argc, const char* argv[]) 


// 声明 了 两 个 int 类 型 对 象 a 和 b 
int a = 10, b = 20 


[ez 


// 声明 了 一 个 指向 int 类 型 的 受 restrict 限 定 的 指针 对 象 p， 
// 用 对 象 a 的 地 址 对 它 初始 化 
int* restrict p = &a; 


// 声明 了 一 个 指向 int 类 型 的 受 restrict 限 定 的 指针 对 象 q， 
// 用 对 象 b 的 地 址 对 它 初始 化 
int* restrict q = &b 


// 以 下 这 条 语句 是 非法 的 ! 两 个 restrict 限 定 的 指 旬 [不 能 指向 同一 个 存储 空间 。 
// 尽管 编译 器 对 此 不 会 有 任何 警告 ， 但 可 能 会 引发 未 定义 的 结 
p= qs 


Fun( (int[]){*p, *q}); 


// 以 这 条 语句 是 非法 的 ， restrict 不 能 用 于 修饰 非 指 针 类 型 
restrict int x = 0 


// 以 这 条 语句 是 非法 的 ， (*t) 类 型 为 jnt， 不 是 指针 类 型 
restrict int *t = NULL; 


// 下 面 定义 了 两 个 数组 ， 均 含有 1024 个 元 素 
int32_t dst[1024] = { 0 } 
int32_t Src[1024] 


A/ 对 src 数 组 元 素 做 初始 化 
for(int i = 0; i < 1024; i++) 
src[i] = 工 


// 调用 我 们 自制 的 高 效 存 储 器 拷贝 琴 数 
MyfastMemCpy(dst, src, 1024); 


// 最 后 我 们 验证 一 下 结果 
for(int i = 0; i < 1024; i++) 


if(src[i] != dst[i]) 
{ 


puts("Result not equal!"),; 
return -1; 
} 
} 


puts("Result equal!"); 


从 代码 清单 12-8 中 可 知 ， 对 restrict 限 定 的 指针 的 使 用 有 其 随意 
性 ， 我 们 在 写 代 码 的 时 候 如 末 无 意 间 破坏 了 restrict 的 要 求 ， 编 译 器 也 
无 法 识别 ， 因 为 要 实现 这 种 识别 对 编译 器 来 说 开销 会 比较 大 。 所 以 
restrict 关 键 字 一 般 用 于 函数 形 参 ， 提 示 函 数 使 用 者 所 传 入 的 对 象 地 址 
要 确保 其 唯一 性 。 我 们 在 满足 restrict 要 求 的 时 候 ， 我 们 可 以 提供 更 高 
效 的 运行 时 库 ， 比 如 像 代码 清单 12-8 中 的 MyFastMemCpy 函 数 。 当 我 
们 确保 pDst 与 pSrc 这 两 个 指针 所 指向 的 存储 空间 相互 独立 且 不 车 交 
时 ， 我 们 可 以 采取 各 种 优化 措施 ， 比 如 可 以 多 个 元 素 多 个 元 妈 一 起 找 
贝 ， 只 要 CPU 有 这 种 能 力 。 但 是 ， 倘 者 我们 传 入 的 指针 所 指 癌 的 存储 
空间 不 能 满足 唯一 性 ， 或 者 说 当中 有 对 多 ， 那 束 别 说 多 个 元 素 一 起 找 


贝 了 ， 即 便 连 指针 所 指向 对 象 类 型 的 粒度 《这 里 是 int32_t 类 型 ) 进行 
拷贝 都 无 法 确保 数据 正确 性 〈 比 如 代码 清单 12-7 所 呈现 的 情况 ) ， 只 


好 一 个 学 廊 二 个 学 玉 进 行 拷贝。 


12.4 Atomic 限 定 符 


_Atomic 限 定 符 是 在 最 新 的 C11 标 准 中 所 引入 的 。 所 以 它 限 定 类 型 
的 方式 比 起 const、volatile 以 及 restrict 有 所 不 同 ， 它 直接 用 _Atomic (类 
型 名 ) 这 种 方式 作为 原子 类 型 说 明 符 。 为 何 _Atomic 能 使 用 这 种 形式 作 
为 类 型 限定 符 呢 ?因为 _Atomic 一 般 修饰 的 是 非 指 针对 象 类 型 ， 所 以 不 
率 涉 限 定 指 癌 数组 的 指针 以 及 指 回 画 数 的 指针 这 些 比较 特殊 的 类 型 表 
DAY) 


如 条 将 一 个 对 象 声 明 为 原子 类 型 ， 那 么 说 明 该 对 象 是 原子 的 ， 这 
也 称 为 "原子 对 象 ”。 原 子 对 象 的 访问 与 非 原 子 的 有 所 不 同 ， 对 一 个 原 
子 对 象 的 读 和 写 都 是 不 可 被 打 断 的 ， 此 外 有 很 多 针对 原子 对 象 的 修改 
操作 (比如 加 减 算术 计算 以 及 各 种 逻辑 计算 等 原子 操作 ) ， 这 些 原子 
操作 也 是 不 可 被 打 断 的 。 一 个 操作 不 可 被 打 断 意味 着 在 执行 整个 操作 
过 程 中 ， 即 便 有 一 个 硬件 中 断 信号 过 来 ， 该 中 断 信号 也 不 能 立即 触发 
处 理 器 的 中 断 执行 例 程 ， 处 理 吉 必须 执行 完整 条 原子 操作 之 后 才 可 进 
入 中 断 执行 例 程 。 对 于 中 断 控制 器 而 言 往往 会 有 “未 决 ”(Pending) 这 
个 状态 ， 说 明 当 前 中 断 尚 未 被 处 理 。 我 们 在 使 用 原子 操作 的 时 候 不 用 
担心 当前 的 执行 线程 会 被 切换 ， 因 为 中 断 处 理 都 不 会 发 生 。 原 子 对 象 
往往 用 于 多 核 多 线程 并 行 计算 中 对 多 个 线程 共享 变量 的 计算 。 


原子 操作 的 另 一 大 特点 是 ， 对 于 来 自 多 个 处 理 器 核心 对 同一 个 存 
储 空间 的 访问 ， 存 储 器 控制 器 会 去 仲裁 当前 哪个 原子 操作 先进 行 访 存 
操作 ， 哪 个 后 进行 ， 这 些 访 存 操作 都 会 被 串 行 化 ， 所 以 这 对 于 多 核 多 
线程 并 行 计算 的 数据 同步 而 言 是 必需 的 处 理 器 特征 。 我 们 无 法 通过 简 
单 的 开关 中 断 去 控制 各 个 核心 同时 执行 不 同 线程 的 行为 与 状态 ， 所 以 
在 多 核心 多 线程 并 行 计算 的 环境 下 ， 原 子 操作 是 唯一 的 数据 同步 手 
段 。 另 外 在 此 环境 下 ， 像 互 斥 体 (mutex) 、 信 号 量 (semaphore) 等 同 
步 原 语 的 实现 也 都 基于 原子 操作 。 


我 们 在 C11 标 准 下 的 C 语 言 中 使 用 原子 操作 时 ， 应 当 包含 
<stdatomic.h> 标 准 库 头 文件 ， 该 头 文件 中 已 经 预定 义 了 一 些 当 前 主流 处 
理 器 所 能 支持 的 原子 对 象 类 型 ， 此 外 还 有 相应 的 原子 操作 函数 。 我 们 
在 实际 使 用 原子 类 型 时 应 当 避 人 免 直接 使 用 _Atomic (类 型 名 ) 这 种 形 
式 ， 而 是 直接 用 <stdatomic.h> 头 文件 中 已 经 定义 好 的 原子 类 型 。 当 前 
C11 标 准 中 所 罗列 的 能 够 支持 原子 对 象 类 型 的 基本 类 型 均 为 整数 类 型 ， 
也 就 是 说 除 整 数 类 型 外 的 其 他 类 型 都 无 法 作为 原子 对 象 类 型 (包括 浮 
点 类 型 )。 我 们 常用 的 原子 对 象 类 型 有 : atomic_bool、atomic_char、 
atomic_ schar ~ atomic uchar ~、 atomic ushort ~、 atomic short 、 
atomic_int 、 atomic_ uint 、 atomic long ~、 atomic_ulong 、 
atomic_char16_t、 atomic char32 t 、 atomic wchar t、 atomic intptr t、 


atomic_uintptr_t、atomic_size_t、atomic_ptrdiff_t 等 。 像 这 里 面 


atomic_int 类 型 就 被 定义 为 _Atomic (int) ， 而 像 atomic_size_t 类 型 就 被 


定义 为 Atomic (size t) 。 


此 外 ， 原 子 对 象 的 初始 化 与 普通 对 象 也 有 所 不 同 ， 在 <stdatomic.h> 
头 文件 中 定义 了 两 个 接口 ， 分 别 用 于 对 全 局 原子 对 象 与 函数 内 局 部 原 
子 对 象 进行 初始 化 。 另 外 ， 对 原子 对 象 的 读 写 也 不 应 该 直接 用 = 赋值 操 
作 符 ， 而 是 需要 通过 使 用 atomic load 函数 进行 读 ，atomic_store 函 数 进 
了 写 。 代 码 清单 12-9 将 先 简单 介绍 原子 对 象 的 一 些 基本 操作 。 


代码 清单 12-9 ”原子 对 象 的 初步 使 用 


#include <stdio.h> 
#include <stdatomic.h> 


// 这 里 声明 了 一 个 int 类 型 的 静态 原子 对 象 SIntAtom 
// 我 们 通过 ATOMIC_VAR_INIT 宏 函数 对 其 初始 化 为 100 
static atomic_int SIntAtom = ATOMIC_VAR_INIT(100); 


int main(int argc, const char* argv[]) 


// 这 里 在 main 函 数 中 声明 了 局 部 原子 对 象 a 


atomic_int a; 


// 我 们 通过 atomic_init 泵 数 对 原子 对 象 a 进行 初始 化 为 10 
atomic_ init(&a, 10); 


// 我 们 通过 atomic_store 画 数 将 原子 对 象 a 修 改 为 20 
atomic_store(&a, 20); 


// 我 们 通过 atomic_1load 苏 数 将 原子 对 象 a 的 值 加 载 到 普通 对 象 b 中 
b = atomic load(&a); 


// 我 们 利用 atomic_fetch_add 函 数 ， 对 原子 对 象 SIntAtom 与 普通 对 象 b 做 原子 加 法 操作 。 
// 此 时 返回 的 结果 是 做 原子 加 法 操作 之 前 的 SIntAtom 的 值 
int oldValue = atomic fetch add(&sIntAtom, b); 


printf("oldValue = %d\n", oldValue); 


// 我 们 将 原子 加 法 操作 之 后 的 SIntAtom 原 子 对 象 的 值 ， 加 载 到 对 象 b 中 
b = atomic_ load(&sIntAtom); 


printf("sIntAtom = %d\n", b); 


代码 清单 12-9 清 晰 而 又 精简 地 介绍 了 对 原子 对 象 的 各 类 操作 。 这 里 
给 大 家 呈现 的 是 对 原子 对 象 的 初始 化 、 加 载 、 存 储 以 及 原子 加 法 操 
作 。 除 了 原子 加 法 操作 之 外 ，C11 标 准 还 定义 了 以 下 原子 算术 逻辑 操 
作 : atomic_fetch_sub (原子 减法 操作 ) 、atomic_fetch_or (原子 按 位 或 
操作 ) 、atomic_fetch_xor (原子 按 位 异 或 操作 ) 、atomic_fetch_and 
(原子 按 位 与 操作 ) 。 这 里 要 注意 的 是 ， 这 些 算术 逻辑 原子 操作 都 不 
能 用 于 atomic_bool 类 型 ， 即 布尔 原子 类 型 。 另 外 这 里 需要 注意 的 是 ， 
对 原子 对 象 的 初始 化 函数 本 身 并 非 原子 的 ， 也 就 是 说 ，atomic_init 函 数 
是 可 被 打 断 的 。 因 此 我 们 在 对 原子 对 象 做 初始 化 时 应 当 统一 在 一 个 线 
程 中 完成 〈 通 常 是 主线 程 ) ， 然 后 再 做 线程 分 派 调度 。 另 外 ， 我 们 不 
应 该 使 用 atomic_store 原 子 存储 操作 对 原子 对 象 进 行 初始 化 ， 对 原子 对 
象 的 初始 化 操作 只 有 ATOMIC_VAR_INIT 与 atomic_init 这 两 个 接口 。 同 
时 ， 其 他 原子 操作 必须 作用 于 已 初始 化 的 原子 对 象 ， 否 则 结果 可 能 是 
未 知 的 。 


代码 清单 12-10 将 给 大 家 带 来 一 个 比较 实用 的 例子 来 描述 原子 对 象 
以 及 原子 操作 的 使 用 与 效果 。 在 这 个 例子 中 ， 我 们 将 定义 一 个 
10000x100 的 一 个 int 类 型 的 二 维 数 组 ， 并 对 它 的 所 有 元 素 进行 求 和 操 
作 。 我 们 将 使 用 双核 双 线 程 并 行 计算 来 达成 这 个 目的 。 


代码 清单 12-10 ”双核 双 线 程 对 二 维 数组 求 和 


#include <stdio.h> 
#include <stdatomic.h> 


#include <stdbool.h> 
#include <stdint.h> 
#include <pthread.h> 


// 声明 一 个 静态 unsigned long long 类 型 的 原子 对 象 ， 初 始 化 为 9， 
// 用 于 存放 原子 计算 操作 的 求 和 计算 结果 
static volatile ‘atomic_ullong sAtomResult = ATOMIC_VAR_INIT(0); 


77 志明 一 个 静态 的 int 关 型 的 原 于 对象， 初始 化 为 6， 
// 用 于 存放 原子 计算 操作 的 当前 计算 数组 的 行 索引 
static volatile atomic int sAtomIndex = ATOMIC_VAR_INIT(0) ; 


// 声明 一 个 静态 普通 的 uint64_t 类 型 对 象 ， 并 将 它 初始 化 为 9， 
// 用 于 存放 普通 计算 操作 的 求 和 计算 结果 
static volatile uint64 t sNormalResult = 0; 


// 声明 一 个 静态 普通 的 Int 类 型 对 象 ， 并 将 它 初始 化 为 ， 
// 用 于 存放 普通 计算 操作 中 当前 计算 数组 的 行 索引 
static volatile int sNormalIndex = 0; 


// 由 于 这 个 标志 在 用 户 线程 中 只 写 ， 且 在 主线 程 中 只 
// 寻 此 在 这 者 线程 中 并 ` 会 生 数 居 竞 所 以 哆 需 合 jj 原 了 对 象 
static volatile bool sIsThreadComplete = false; 


// 声明 即将 用 于 计算 的 二 维 数 组 
static int sArray[10000][100]; 


// 定义 普通 计算 操作 的 线程 例 程 


static void* NormalSumProc(void *param) 


{ 
// 这 里 使 用 一 个 currIndex 对 象 ， 使 得 SNormalIndex 在 每 次 迭代 中 仅 被 读 取 一 次 ， 
// 减少 9 部 修改 的 干扰 
int currIndex' 
// 在 每 次 送 代 时 ， 先 读 取 当 前 行 索引 的 值 ， 然 后 立即 对 它 做 递增 操作 
while((currIndex = SNormalIndex++) < 10000) 
{ ss 2 
// 得 到 当前 行 索引 之 后 ， 对 当前 行 的 数组 做 求 和 计算 
Uint64 t sum = 0; 
for(int i = 0; i < 100; i++) 
sum += sArray[currIindex][i]; 
sNormalResult += sum; 
} 
// 用 户 线程 计算 结束 ， 将 sSIsSThreadComplete 标 志 置 为 true 
sIsThreadComplete = true; 
return NULL 
} 


// 定义 原子 操作 计算 的 线程 例 程 
static void* AtomSumProc(void *param) 


{ 


int currIndex' 


while((currIndex = atomic fetch add(&sAtomIndex, 1)) 


< 10000) 
{ 
Uint64 t sum = 0; 
for(int i = 0; i < 100; i++) 
sum += sArray[currIindex][i]; 
atomic_ fetch add(&sAtomResult, sum); 
} 


sIsThreadComplete = true,; 


int 


return NULL; 


main(int argc, const char* argv[]) 


// 我 们 先 对 sArray 数 组 进行 初始 化 
for(int i = 0; i < 10000; i++) 


j < 100; j++) 
j] = 100 * + jj; 


for(int j = 0; 
sArray[i][j 
} 


// 我 们 先 在 主线 程 中 计算 出 标准 正确 的 计算 结果 
uint64_t standardResult = 0; 


for(int i = 0; i < 10000; i++) 
for(int j = 0; j < 100; j++) 
standardResult += sArray[i][j]; 
} 


printf("The standard result is: %llu\n", standardResult); 


// 下 面 我 们 先 观 察 不 用 原子 对 象 与 原子 操作 的 计算 
pthread_t threadID; 


pthread_create(&threadID, NULL, &NormalSumProc, NULL); 
// 在 主线 程 中 也 做 类 似 的 计算 处 理 


int currIindex; 


// 使 用 原子 加 法 操作 对 当前 原子 数组 行 索 引 做 后 级 递增 操作 


while((currIindex = SNormalIndex++) < 10000) 


Uint64 t sum = 0; 
for(int i = 0; i < 100; i++) 
sum += sArray[currIindex][i]; 


sNormalResult += Sum， 


} 


// 等 待 用 户 线程 完成 
while(!sIsThreadComplete); 


if(sNormalResult == standardResult) 
puts("Normal compute compared equal!"); 
else 


printf("Normal compute compared not equal: %llu\n", 
sNormalResult); 


} 


// 我 们 最 后 对 原子 操作 的 线程 做 并 行 计算 
SISThreadCompJlete = false; 


pthread_create(&threadID, NULL, &AtomSumProc, NULL); 


while((currIindex = atomic_ fetch_add(&sAtomIndex, 1)) 
< 10000) 
{ 


Uint64 t sum = 0; 
for(int i = 0; i < 100; i++) 
sum += sArray[currIindex][i]; 


atomic_fetch_add(&sAtomResult, sum); 


// 等 待 用 户 线程 完成 
while(!sIsThreadComplete); 


if(atomic load(&sAtomResult) == standardResult) 
puts("Atom compute compared equal!"); 


se 
puts("Atom compute compared not equal!"); 


代码 清单 12-10 不 仅 有 原子 操作 的 求 和 计算 ， 而 且 还 有 不 采用 原子 
操作 的 求 和 计算 。 我 们 可 以 实际 操作 一 下 ， 能 观察 到 者 采用 普通 求 和 
计算 往往 无 法 得 到 正确 的 计算 结果 ， 且 计算 结果 的 值 每 次 执行 还 都 不 
一 样 。 这 就 是 因为 像 ++ 操 作 、+ 操 作 的 非 原 子 性 造成 的 。 像 这 类 修改 操 
作 其 实 有 三 个 步骤 : 读 取 数据 、 修 改 数据 、 存 储 数据 。 比 如 像 a++;， 这 
个 操作 ， 如 采用 处 理 器 指令 来 表示 的 话 至 少 需 要 三 条 指令 一 一 load 
reg，[a] 〈 将 对 象 a 的 值 加 载 到 reg 寄 存 器 中 ) ; inc reg (对 reg 寄 存 器 做 
递增 操作 ) ; store reg，[a] 〈 将 reg 寄 存 器 的 值 再 写 回 对 象 a 中 ) 。 对 于 
原子 加 法 操作 而 言 ， 它 们 将 被 组 合成 一 单条 指令 ， 并 且 整 个 操作 过 程 
不 能 被 打 断 。 而 对 于 普通 操作 ， 这 三 条 指令 每 条 执行 完 之 后 都 能 被 打 
岂 ， 这 束 使 得 一 个 线程 对 寄存 絮 做 了 修改 之 后 ， 但 在 写 回 之 前 被 其 他 
线程 先 写 回 了 ， 然 后 等 该 线程 再 写 回 就 把 先前 线程 修改 的 内 容 给 履 盖 
了 ， 从 而 造成 了 数据 的 不 一 致 性 。 关 于 这 个 时 序 问 题 我 们 可 以 通过 图 
12-1 来 清晰 看 到 。 


图 12-1 中 上 半 部 分 是 非 原 子 的 修改 操作 ， 下 半 部 分 是 原子 的 修改 操 
作 。 我 们 可 以 清晰 地 观察 到 对 于 非 原子 的 读 一 修改 一 写 操作 之 间 存 在 
着 间 除 ， 这 些 间 除 都 会 被 CPU 利用 ， 一 旦 有 中 断 信 号 过 来 就 会 被 打 


断 ， 或 者 被 其 他 处 理 僚 核心 的 相关 操作 给 履 疝 。 像 独 12-1 中 ， 线 程 A 与 
线程 B 几 乎 同时 对 一 个 共享 存储 单元 读 取 值 ， 然 而 线程 A 操 作 比较 快 ， 
先 写 回 数据 ， 而 线程 B 操 作 稍 慢 后 写 回 ， 但 是 等 到 线程 B 写 回 数据 的 时 
候 就 直接 把 线程 A 已 修改 好 的 数据 给 完全 禾 盖 了 ! 换 句 话说 ， 线 程 B 并 
没有 基于 线程 A 先 修改 好 的 数据 做 相应 操作 。 而 原子 操作 则 不 一 样 ， 它 
们 是 作为 一 个 整体 的 操作 ， 如 采 同 时 有 两 个 原子 操作 对 同一 共享 存储 
单元 进行 操作 ， 那 么 存储 句 挥 制 絮 会 做 仲裁 哪个 操作 优先 、 哪 个 操作 
断后 ， 并 且 稍 后 执行 的 原子 操作 必定 基于 之 前 修改 完 的 结 采 进行 。 因 
为 一 个 原子 操作 在 被 允许 操作 之 前 ， 连 读 取 操 作 都 不 会 执行 ， 而 当 存 
储 堪 控制 右 允 许 某 个 原子 操作 执行 时 ， 那 么 读 取 一 修改 一 写 回 这 三 个 
操作 才 会 捆绑 着 执行 。 


存储 
谈 - 修 改 - 写 读 - 修 改 - 写 ， 


原子 操作 原子 操作 
ET 


图 12-1 原子 操作 与 非 原 子 操作 的 顺序 图 


Os 当前 Visual Studio Community 2017 中 的 VS-Clang 对 原子 
操作 的 编译 器 后 端 还 没 文 持 好 ， 所 以 各 位 如 果 要 在 Windows 系 统 上 测试 
代码 清单 12-9 与 代码 清单 12-10 中 的 内 容 的 话 ， 请 使 用 基于 GCC 的 
Mingw 或 纯 Clang 编 译作 。 或 参考 GitHub 上 的 代码 : 
https://github.com/zenny-chen/simple-stdatomic-for-VS-Clang。 这 里 提供 
了 基于 VS-Clang 环 境 中 内 建 画 数 对 部 分 原子 操作 的 实现 。 各 位 将 此 


GitHub 中 的 stdatomic.h 以 及 stdatomic.c 放 到 自己 的 工程 项 目 中 ， 然 后 用 


要 include.“stdatomic.h” 进 行 包 含 。 


原子 操作 其 实 属于 一 个 比较 大 的 问题 领域 ， 这 里 仅仅 揭露 了 其 冰 
山 一 角 。C11 标 准 对 于 原子 库 还 有 相关 的 存储 器 次 序 这 个 概念 ， 此 外 还 
有 lock-free 〈 无 锁 ) 同步 算法 所 需 的 原子 操作 ， 这 些 更 高 级 的 话题 我 们 
将 放 到 本 书 姊妹 篇 标准 库 卷 做 详细 描述 。 


12.5 “本章 小 结 


本 章 内 容 属于 C 语 言 中 比较 高 端的 话题 ， 也 十 比较 轮 泌 难 懂 的 部 
分 。 如 果 大 家 对 本 章 所 讲述 的 类 型 限定 符 掌 握 到 雪 弘 目 如 的 境界 的 
话 ， 那 么 离 C 语 言 大 师 也 就 不 还 了 。 对 于 本 章 ， 笔 者 认为 对 于 大 部 分 
蕊 学 者 来 说 光 看 一 过 还 远 远 不 够 ,大 家 需要 不 断 实践 ， 然 后 再 去 巩固 
阅读 ， 相 信 每 次 阅读 都 会 有 新 的 收获 。 


最 后 ， 在 12.4 节 中 提 到 _Atomic 所 使 用 的 _Atomic (类 型 名 ) 这 种 
表达 方式 ， 如 果 我 们 在 使 用 const、volatile 以 及 restrict 时 ， 在 不 涉及 指 
回 数 组 的 指针 与 指 癌 画 数 的 指针 这 些 表 达 方 式 的 情况 下 也 可 以 这 人 么 
玩 ， 代 码 请 单 12-11 将 给 大 家 呈现 这 种 奇妙 的 表达 方式 。 


代码 清单 12-11 有 趣 的 类 型 限定 符 表 达 方 式 


#include <stdio.h> 


// 我 们 自己 定义 一 个 类 似 于 _Atomic 用 法 的 宏 CONST 
#define CONST(type) type const 


int main(int argc, const char* argv[]) 


// 声明 一 个 int 类 型 的 常量 对 象 a， 并 初始 化 为 19 
CONST(int) a = 10; 


int b = 0; 


// 声明 一 个 普通 指针 对 象 ， 指 向 a 的 地 址 
// (*p) 的 类 型 为 const int 
CONST(int) *p = &a; 


声明 一 个 常量 指针 对 象 q， 
// qd 的 类 型 为 int * const 
CONST(int*) q = &b; 
*q += 20) 

// 声明 一 个 指针 对 象 pp， 指 向 指针 p 的 地 址 


oo 


旨 向 对 象 b 的 地 址 


// 其 类 型 为 const int * const * 
CONST(CONST(int)*) *pp = &p; 
printf("The Value is: %d\n", **pp + *q); 


对 于 代码 清单 12-11 我 们 可 以 看 到 ， 只 有 在 CONST 辆 括号 里 包围 
的 类 型 才 是 种 量 类 型 。 像 指针 对 象 p，CONST 所 包围 的 是 int 类 型 ， 所 
以 指针 p 本 身 不 是 常量 ,而 (*p) 才 是 。 而 指针 对 象 g 则 相反 ，CONST 
包围 的 是 intt， 所 以 指针 对 象 g 本 二 是 常量 , 但 (*q) 则 不 是 。 而 对 于 
比较 复杂 的 pp 对 象 ， 最 外 围 的 CONST 包 围 的 是 CONST (int) * 类 型 ， 
所 以 pp 自身 不 是 一 个 常量 ; 但 (*pp) 就 是 了 ， 它 的 类 型 就 是 CONST 
(CONST (int) *) ; 而 (**pp) 的 类 型 则 是 CONST (int) ， 明显 也 


日 mc ES 
是 个 销量 。 


所 以 ， 只 要 把 基本 的 概念 掌握 之 后 ， 我 们 可 以 目 己 抽象 出 一 套 解 
析 方 法 。 无 论 志 么 变 ， 万 变 不 离 其 宗 。 


第 13 章 ”C 语 言 的 类 型 系统 


类 型 系统 (type system) 在 许多 强 类 型 编程 语言 中 扮演 了 非常 重 
要 的 角色 ， 比 如 C、C++、Java、Objective-C、Swift， 等 等 。 这 些 编程 
语言 中 ， 不 同类 型 的 对 象 本 身 所 具有 的 含义 、 能 表示 的 值 的 范围 等 都 
可 能 有 所 不 同 。 我 们 在 前 几 章 中 已 经 详细 讲述 了 C 语 言 的 基本 类 型 、 
用 户 自 定义 类 型 、 指 针 、 数 组 等 ， 此 外 还 有 类 型 限定 符 。 这 些 类 型 、 
类 别 与 限定 符 的 相互 组 合 能 构成 多 种 不 同 的 完整 类 型 ， 使 得 C 语 言 的 
类 型 具有 丰富 多 样 性 ， 同 时 也 具有 灵活 性 与 统一 性 。C 语 言 的 类 型 系 
统 是 相当 完备 的 ， 这 意味 着 我 们 通过 C 语 言 现 有 的 语法 特征 ， 无 论 怎 
么 组 合 ， 都 能 构造 出 一 个 合法 的 类 型 来 。 


本 章 将 给 大 家 总 结 并 更 深入 地 介绍 C 语 言 的 类 型 系统 ， 让 大 家 深 
刻 体会 到 其 中 的 博大 精深 。 然 后 给 大 家 介绍 一 下 C11 标 准 中 对 类 型 的 
各 种 分 类 方法 。 最 后 一 小 节 将 引入 C 语 言 的 男 一 个 非常 有 用 的 语法 特 
征 一 一 typedef， 可 以 将 任 一 类 型 抽象 为 一 个 类 型 标识 符 。 


13.1 对 象 类 型 与 画 数 类 型 


C 语 言 的 对 象 类 型 由 三 大 部 分 组 成 一 一 类 型 说 明 符 (type 
specifier) 、 类 型 限定 符 (type qualifier) 、 对 象 类 别 (type 
category) 。 类 型 说 明 符 包括 了 像 void、char、short、int 等 基本 类 型 ， 
还 有 结构 体 、 联 合体 说 明 符 ， 枚 举 说 明 符 ， 原 子 类 型 说 明 符 以 及 
typedef 名 。 类 型 限定 符 包 括 const、volatile 以 及 restrict (这 里 已 经 把 
_Atomic 限 定 的 类 型 归 类 为 原子 类 型 说 明 符 ) 。 对 象 类 别 主要 就 是 数组 
与 指针 类 别 。 


而 函数 类 型 由 图 数 的 返回 类 型 与 形 参 列表 组 成 。 其 中 ， 返 回 类 型 
与 形 参 列表 中 每 个 形 参 的 类 型 都 是 对 象 类 型 。 如 采 形 参 列 表 为 裤 ， 那 
么 形 参 列表 可 用 void 声明 。 


我 们 在 判定 一 个 对 象 的 类 型 时 ， 首 先 应 该 先 判 定 当 前 对 象 的 类 
别 ， 即 它 是 一 个 普通 对 象 还 是 一 个 数组 对 象 或 是 指针 对 象 。 对 象 类 别 
苹 互 不 的 ， 也 就 是 说 ， 如 来 一 个 对 象 是 普通 对 象 ， 那 么 它 束 不 可 能 再 
征 指针 对 象 或 数组 对 象 。 因 此 ， 一 个 对 象 的 类 别 只 能 是 普通 、 指 针 与 
数组 中 的 一 个 。 知 道 了 类 别 之 后 ， 我 们 整 可 以 再 判定 该 对 象 的 完整 类 
型 ， 包 括 如 何 被 限定 符 修 饰 等 等 。 代 码 清单 13-1 给 出 了 一 些 对 象 类 型 
与 函 数 类 型 的 例子 。 


代码 清单 13-1 对 象 类 型 与 函数 类 型 


#include <stdio.h> 


// 这 里 声明 了 一 个 静态 全 局 数组 对 象 SArray， 其 类 型 为 int [3] 
// 它 具 有 3 个 int 类 型 的 元 素 
static int SArray[3] = { 1, 2, 3 }; 


// 定义 了 Func1 函 数 ， 其 类 型 为 ; Int* Ga 
// 表示 画 数 返 回 类 型 为 int* ， a 表 中 个 参数 ， 其 类 型 为 int 
static int* Funci(int a) 


printf("Func1i a = %d\n", a); 
return sArray; 


} 

// 定义 了 Func2 画 数 ， 其 类 型 为 : int (* (int, float) )[3]， 
/7 表示 该 画 数 返回 类 型 为 nt (*) [3]， BB 参 列 家 具有 两 个 参数 ， 第 一 个 形 参 a 具有 int 类 型 ， 
// 第 二 个 形 参 f 具 有 float 类 型 


static int (*Func2(int a, float f))[3] 


printf("Func2 Sum = %f\n", a + f); 
return &sArray; 


} 
int main(int argc, const char* argv[]) 
{ 
// 这 里 声明 了 一 个 指针 对 象 p， 其 类 型 为 const int * 
// 用 Funcd 画 数 调用 的 返回 值 为 它 初始 化 
const int *p = Func1(3)， 
printf("*p = %d\n", *p); 
// 这 里 声明 了 一 个 指针 对 象 pFunc， 它 指向 函数 Func2 
int (*pFunc)(int, float))[3] = &Func2; 
pFunc(3, 10.5f)[0][1i]++; 
// 声明 了 int 类 型 的 普通 对 象 elem 
int elem = sArray[1]; 
printf("elem = %d\n", elem); 
} 


代码 请 单 13-1 中 ， 静 仿 全 局 对 象 SArray 的 类 别 是 一 个 数组 ，main 
函数 中 声明 的 对 象 p 与 pFunc 的 类 别 都 是 指针 ， 而 对 象 alem 则 是 一 个 普 
通 对 象 。 这 里 也 清楚 地 摘 述 了 函数 的 返回 类 型 以 及 形 参 类 型 ， 它 们 都 
征用 对 象 类 型 来 表示 的 。 


代码 清单 13-1 中 的 Func2 函 数 的 类 型 以 及 main 芳 数 中 声明 的 pFunc 

函数 指针 对 和 象 类 型 比较 复杂 ， 我 们 将 在 13.3 节 中 详细 分 析 这 种 复杂 的 

类 型 声明 方式 以 及 对 其 类 型 的 谢 析 。 另 外 ， 本 和 大 致 介绍 了 对 和 象 与 图 
数 类 型 的 构成 ， 这 将 作为 下 面 儿 和 的 基础 。 


13.2 ”对 声明 符 的 进一步 说 明 

为 了 能 让 各 位 更 深刻 地 理解 一 个 对 象 与 函数 的 类 型 ， 我 们 这 里 将 
引入 比较 完整 的 C11 标 准 所 给 出 的 声明 文法 。 

declaration: 

declaration-specifier init-declaratorlistopt; 

static_assert-declaration 

declaration-specifier: 

storage-class-specifier declaration-Specifieront 
type-specifier declaration-specifieront 
type-qualifier declaration-Specifieropt 
function-specifier declaration-Specifieropt 
alignment-specifier declaration-Specifieront 


init-declarator-list: 


init-declarator 


init-declarator-list, init-declarator 
init-declarator: 
declarator 


declarator=initializer 


我 们 从 上 述 关 于 声明 的 文法 中 可 以 看 到 ，C 语 言 中 声明 包含 了 两 
大 部 分 : 一 个 是 声明 说 明 符 (declaration-specifier) ， 另 一 个 是 声明 符 
(declarator) 。 我 们 在 看 声明 符 之 前 可 以 演 试 代码 清单 13-2 中 这 些 奇 
怪 但 又 符合 文法 的 写法 。 


代码 清单 13-2 无 声明 符 的 声明 


int main(int argc, const char* argv[]) 


static,; 
extern const int,; 
_Alignas(8); 


代码 清单 13-2 中 列 出 的 三 个 声明 都 是 合法 有 效 的 声明 ， 尽 管 在 纺 
译 时 编译 絮 会 报 出 “此 声明 没有 声明 任何 东西 ”之 类 的 警告 。 因 为 在 声 
明 的 文法 中 也 明确 指出 ， 在 声明 说 明 符 中 后 面 的 初始 化 声明 符 列表 可 
省 ， 当 然 最 后 的 分 号 是 必须 有 的 。 下 面 我 们 再 来 看 声明 符 的 文法 。 


declarator: 


pointer direct-declarator 


opt 
direct-declarator: 

identifier 

(declarator) 

direct-declarator [type-qualifier-listoy: assignment-expressionopt] 


direct-declarator [statictype-qualifier-listopt assignment-expression] 


direct-declarator [type-qualifier-listoy Static assignment- 


expression | 
direct-declarator [type-qualifierlistoo * | 
direct-declarator & (parameter-type-list) 
direct-declarator ”identifier-listopt) 
pointer: 
*type-qualifier-listont 


*type-qualifier-listopt pointer 


type-qualifier-list: 


type-qualifier 
type-qualifier-list type-qualifier 


我 们 这 里 可 以 看 到 ， 指 针 与 数组 类 别 都 是 在 声明 符 中 体现 出 来 
的 。 此 外 ， 无 论 在 上 壕 的 声明 说 明 符 中 还 是 在 这 里 的 直接 说 明 符 
(direct-declarator) 中 ， 我 们 都 看 到 了 类 型 限定 符 的 身影 。 因 此 ， 我 
们 也 可 以 将 类 型 限定 从 看 作 既 可 以 修饰 类 型 ， 也 可 以 修饰 类 别 。 此 
外 ， 我 们 在 数组 [里 也 可 以 看 到 其 中 能 够 包含 一 条 赋值 表达 式 。 这 个 
在 之 前 描述 数组 的 时 候 并 未 涉及 太 多 ， 由 于 确实 用 得 很 少 ， 并 且 这 也 
是 自 C99 标 准 中 引入 了 可 变 长 度数 组 之 后 才 引 入 的 语法 特性 。 代 码 清 
单 13-3 先 对 此 语法 特性 进行 措 述 。 


Ce" 


代码 清单 13-3 ”数组 声明 的 下 标 中 含有 赋值 表达 式 的 情况 


#include <stdio.h> 


// 这 里 定义 了 静态 函数 Func1， 带 有 两 个 形 参 ， 形 参 a 是 int 类 型 ; 
// 形 参 s 则 是 一 个 int * const 类 型 ， 这 里 用 一 个 变 长 数组 来 表示 
static void Funci(int a, int s[static const a += 5]) 


// 注意 ， 这 里 形 参 s 中 动用 了 a += 5， 
// 这 意味 着 当 画 数 Funci 被 调用 时 ， 形 参 a 的 值 会 自动 加 5 
printf("Funci a = %d\n", a); 


int main(int argc, const char* argv[]) 
int a = 1; 


Func1i(10, &a); 


// 这 里 声明 了 一 个 变 长 数组 对 象 S， 
// 在 数组 下 标 里 使 用 了 一 个 赋值 表达 式 ， 使 
int s[a += 10]; 


// s 数 组 具有 11 个 Int 元素 
printf("The size of s = %zu\n", sizeof(s) / sizeof(s[0])); 


// a 的 值 为 11 


导 局 部 对 象 a 的 值 加 10 


一 
Im 


printf("a = %d\n", a); 


代码 清单 13-3 描 述 了 声明 数组 对 象 时 ， 在 数组 下 标 里 使 用 赋值 表 
达 陈 的 情况 这 得 花 于 C 语 言 中 二 赋值 操作 符 与 十 二 等 复合 赋值 操作 符 
直接 返回 它们 左 操作 数 的 值 的 语法 特性 。 当 然 ， 对 于 这 种 写法 不 建议 
滥用， 因为 这 并 不 会 让 代码 看 上 去 有 多 简洁 ， 反 而 容易 让 人 看 得 眩 
这 里 引出 这 个 代码 示例 主要 是 针对 C11 标 准 中 给 出 声明 符 的 文法 
而 言 的 ， 大 家 看 到 了 文法 定义 ， 自 然 就 可 写 出 很 多 有 趣 的 (但 可 能 
不 实用 的 ) 表达 式 和 语句 。 


下 面 我 们 将 详细 谈 谈 和 直接 声明 符 中 第 二 个 文法 一 一 
(declarator) 。 这 种 形式 一 般 用 于 声明 指向 数组 的 指针 以 及 指向 画 数 
的 指针 对 象 。 不 过 对 于 普通 对 象 ， 其 他 指针 对 象 以 及 数组 对 象 也 均 能 
使 用 这 种 声明 符 表 达 方 法 。 代 码 清单 13-4 将 给 出 使 用 例子 。 


代码 清单 13-4 (declarator) 的 声明 方式 


#include <stdio.h> 
int main(int argc, const char* argv[]) 


// 声明 了 int 类 型 对 象 a 
int (a) = 0; 


// 声明 了 指向 const int 类 型 的 指针 对 象 p 
const int (*p) = &a; 


// 声明 了 指向 Int 类 型 的 常量 指针 对 象 q 
int (* const q) = &a; 


// 声明 ] 具有 三 个 ijnt 类 型 元 素 的 数组 对 象 b 
int (1 ={1 2,3}; 


// 声明 了 一 个 具有 三 个 int* 类 型 元 素 的 数组 对 象 c 
int* (c)[3] = = {i &a }; 


// 这 里 声明 j Od 
int (* const r)[3] = pF 


// 这 里 声明 了 包含 两 个 int 类 型 元 素 的 数组 对 象 d 
int (d[2])= {90}; 


// 这 里 声明 了 包含 两 个 ijnt 类 型 元 素 的 数组 对 象 e 
int ((e)[2])= {9090}; 


// const int (*) 可 以 直接 作为 完整 类 型 进行 类 型 转换 ， 这 相当 于 const int * 
printf("a = %d\n", *(const int(*))p); 


// 同样 ，int((*) )[3] 也 可 直接 作为 完整 类 型 进行 类 型 转换 ， 
// 这 里 ((* ) ) 与 (*) 的 作用 也 是 一 样 的 ， 相 当 于 int (*)[3] 
printf("b[o] = %dxn"，((int((*))[3])r)[o]j[9]); 


printf("Remain result: %d\n", *q + *c[0] + d[0] + e[1]); 


从 代码 清单 13-4 中 我 们 可 以 看 到 原本 为 指 疝 数 组 的 指针 与 指 癌 函 
数 的 指针 而 设计 的 (declarator) ， 由 于 在 实际 使 用 中 C 语 言 标 准 没 有 
对 其 他 声明 做 太 多 约束 ， 所 以 我 们 可 以 对 此 文法 玩 出 各 种 花样 来 。 在 
代码 清单 13-4 中 ， 除 了 声明 指向 数组 的 常量 指针 对 象 r， 其 他 标识 符 周 
围 的 〈) 都 可 以 省 去 ， 而 语义 不 变 。 


此 外 ， 在 做 类 型 转换 时 ， 如 果 〈) 内 含有 *， 那 么 此 圆 括 号 可 以 保 
留 ， 这 也 是 为 了 迎合 指 癌 数组 的 指针 与 指 癌 函 数 的 指针 类 型 而 设计 
的 ; 如 有 果 没 有 *， 则 不 能 加 () 。 像 int () 这 种 是 非法 的 类 型 表达 方 
a 


13.3 ”更 复 洒 有 的 声明 


我 们 前 两 节 介 绍 了 对 象 类 型 以 及 对 象 与 钞 数 的 声明 ， 本 市 我 们 将 
利用 这 些 知 识 构造 出 更 丰富 且 看 上 去 更 复 洒 的 对 象 类 型 。 尺 管 在 大 部 
分 时 候 ， 像 以 下 介绍 的 复杂 类 型 没 太 大 用 武之 地 ， 但 在 关键 时 候 总 能 
帮 上 忙 ， 而 且 一 旦 学 会 对 这 些 类 型 的 解析 ， 那 么 相信 再 复杂 的 语法 特 
性 也 难 不 倒 你 了 。 我 们 将 分 三 步 为 大 家 介绍 目 己 如 何 编写 或 去 读 慌 一 
些 更 复杂 的 对 象 类 型 以 及 函数 类 型 。 


13.3.1 将 茶 一 类 型 转换 为 指 癌 该 类 型 的 指针 


首先 交 给 大 家 的 是 ， 如 何 表达 指向 某 一 个 对 象 的 指针 类 型 。 


例 1: 像 比较 简单 的 ， 我 们 已 经 知道 如 果 声 明了 一 个 对 象 a 
ai ， 那 么 对 象 a 的 类 型 就 古 int， 而 指向 对 象 的 指针 类 型 则 是 int* 类 
型 。 当 然 正 如 上 一 节 所 述 ， 这 里 的 int* 也 可 以 表示 为 int (*) 。 


int 


例 2:， 如 果 声 明了 一 个 数组 对 象 a 一 一 int a[3]; ， 那 么 数组 对 象 a 的 
类 型 为 int[3]， 而 指向 数组 对 象 a 的 指针 类 型 则 为 int (*) [3]。 所 以 我 们 
可 以 发 现 ， 要 将 某 一 类 型 转换 为 指向 该 类 型 的 指针 其 实 非 常 容易 ， 只 


需要 把 用 该 类 型 声明 的 对 象 标识 符 直 接替 换 为 〈*) 即 可 ! 这 里 其 实 惑 
是 把 数组 对 象 标识 符 a 变 为 了 (*) 。 


例 3: 如 有 果 是 一 个 含有 3 个 指 癌 函数 的 数组 ， 比 如 : void 
(*pArray[3]) (int) ; ， 如 果 要 获得 指向 pArray 数 组 对 象 的 指针 类 型 
该 怎么 做 ? 很 简单 ! 直接 将 pArray 变 为 (*) 即 可 一 一 void (* (*) 
[3]) (int) 。 该 类 型 表示 指向 一 个 含有 3 个 元 素 的 数组 的 指针 ， 每 个 
元 素 是 指向 void (int) 类 型 的 函数 指针 。 


13.3.2 ”判定 当前 类 型 属于 哪 种 对 象 类 型 


我 们 了 解 了 上 述 对 象 转 为 指向 该 对 象 的 指针 类 型 之 后 ， 接 下 来 就 
要 区 分 该 类 型 的 类 别 ， 也 就 是 说 ， 给 出 的 类 型 是 普通 对 象 类 型 还 是 指 
针 类 型 抑或 是 数组 类 型 。 普 通 对 象 类 型 非常 简单 ， 只 要 在 类 型 中 不 出 
现 * 号 ， 也 不 出 现下 标 符号 的 ， 那 么 束 古 普通 对 象 类 型 。 这 里 难以 区 
分 的 是 ， 当 在 一 个 类 型 中 同时 出 现 了 * 号 以 及 [] 符 号 时 ， 如 何 判 别 该 类 
型 是 指向 一 个 数组 的 指针 还 古 束 是 数组 类 型 。 这 时 ， 我 们 必须 看 类 型 
表达 式 中 最 里 面 的 那个 (*) 右边 是 否 紧 跟 着 一 个 ]， 如 果 是 ， 则 表明 
它 属 于 指向 数组 的 指针 ;如 果品 出 现在 〈) 内 ， 跟 在 * 右 边 ， 则 表示 它 
古 一 个 数组 对 象 。 像 13.1.1 市 中 的 例 3 中 的 pArray 束 古 一 个 数组 对 象 ， 
因为 我 们 将 pArray 标 识 符 拿 掉 之 后 很 明显 就 能 看 到 ， () 里 的 * 后 面 有 


一 个 [3]。 而 &pArray 则 是 指向 数组 的 指针 类 型 ， 因 为 它 的 类 型 是 void 
(* (x*) [3]) (int) ， 最 里 面 的 (*) 后 面 直接 跟着 一 个 [3]。 


我 们 这 里 也 举 一 些 例子 。 


例 1: 对 于 void (**funcArray[3]) (int) ; ， 对 象 funcArray 束 是 
一 个 数组 ， 而 不 是 一 个 指针 ， 该 数组 中 的 每 个 元 素 是 指向 钞 数 类 型 
void (int) 的 指针 的 指针 ， 即 void (**) (int) 类 型 。 在 C 语 言 中 ，* 
作用 于 一 个 数组 对 象 或 函数 时 ， 有 没有 图 括号 ， 其 语义 是 完全 不 同 
的 。 典 型 的 例子 有 以 下 这 些 。 


例 2，int*p[3]; 表示 对 象 p 是 一 个 数组 ， 每 个 元 素 是 int* 类 型 的 对 


例 3: int (*q) [3]; 表示 对 象 9 是 一 个 指向 int[3] 数 组 类 型 的 指针 。 


例 4: voidxfunc (int) ; 表示 func 是 一 个 函数 ， 其 类 型 为 void* 


(int) 。 


例 5: void (*pFunc) (int) ; 表示 pFunc 是 一 个 指向 void (int) 
类 型 的 函数 的 指针 。 


类 似 地 ， 判 定 一 个 声明 年 声明 一 个 函数 还 是 声明 一 个 对 象 ， 束 看 


最 里 层 的 〈*) 后 面 是 否 立 即 跟着 () 形 参 列表 ， 如 采 是 ， 说 明 声 明 的 
苹 一 个 指 辐 函数 的 指针 类 型 ， 否 则 说 明 是 一 个 函数 类 型 。 比 如 : void 


(* (float) ) (int) ; 表示 声明 的 是 一 个 函数 类 型 ， 因 为 这 里 面 的 * 
并 不 是 以 (*) 形式 出 现 的 ， 并 且 它 具有 一 个 float 类 型 的 形 参 ， 返 回 类 
型 为 void (*) (int) ; 。 而 void (* (*) (float) ) (int) ; 表示 指 
向 一 个 返回 类 型 为 void (*) (int) ， 并 带 有 一 个 float 类 型 形 参 的 函数 
的 指针 。 如 果 (*) 后 面 既 没有 直接 跟 [] 数 组 下 标 符 号 ， 也 没有 跟 () 
函数 形 参 列 表 ， 那 么 * 号 两 芝 的 圆 括号 完全 可 省 。 所 以 对 于 函数 声明 求 
说 ， 其 形 参 列 表 就 对 应 于 数组 声明 的 下 标 。 我 们 可 以 类 比 一 下 int 
(void) 与 int[3]， 以 及 int (*) ” (void) 与 int (*) [3]。 随 后 ， 我 们 通 
过 代码 清单 13-5 将 上 面 所 述 的 小 例子 都 串 起 来 。 


代码 清单 13-5 更 复杂 的 类 型 声明 


#include <stdio.h> 
static void func(int a) 


printf("a = %d\n", a); 


< 


// MyFunc 的 返回 类 型 为 void (*)(int)， 并 带 有 一 个 float 类 型 的 
static void (* MyFunc(float f) )(int) 


BD 


NS 


printf("f = %f\n", f); 


return &func,; 


int main(int argc, const char* argv[]) 


// pArray 是 带 有 3 个 void(* ) (int ) 类 型 元 素 的 数组 ， 
// 其 类 型 为 : void (* [3])(int) 
void (*pArray[3])(int) = { NULL } 


// pp 指向 pArray 数 组 对 象 ， 其 类 型 为 : void (* (*)[3])(int) 
// 注意 ， 这 里 最 里 面 的 (* ) 两 旁 的 ( ) 不 可 省 
void (* (*pp)[3])(int) = &pArray 


pp[9][1] = &func; 
(*pp)[1](10); 


// pFunc 指 向 MyFunc 画 数 ， 其 类 型 为 : void (* (*)(float) )(int) 
void (* (*pFunc)(float))(int) = &MyFunc 


// 这 里 分 别 做 了 两 次 调 次 调用 的 是 MyFunc ， 
// 第 二 次 则 调 9 是 在 MyFunc 匡 族 最 后 所 返回 的 func 郴 数 
pFunc(2.5f)(20); 


工 


当 我 们 知道 了 如 何 表 达 目 己 想 要 的 类 型 之 后 ， 那 么 下 面 我 们 号 再 
看 一 下 如 何 去 解 析 给 定 的 含有 比较 复杂 类 型 的 对 象 与 函数 。 


13.3.3 ”复杂 复合 类 型 的 判断 


通常 ， 对 于 一 个 含有 指针 符号 的 对 象 来 说 ， 我 们 先 从 最 里 面 ( 即 
最 右边 ) 的 * 号 开始 ， 或 者 如 果 类 型 中 合 有 多 重 圆 括号， 那么 从 最 里 面 
那 层 圆 括 号 开始 解析 ， 因 为 它 是 离 对 象 标识 符 最 近 的 ， 也 是 最 能 直接 
表示 该 对 象 所 具备 的 第 一 层 类 型 的 。 


例 1: void (* (*pArray) [3]) ” (int) 。 像 这 里 的 pArray 对 象 是 什 
么 类 型 呢 ? pArray 对 象 的 声明 中 人 对 有 指针 ， 也 含有 圆 括号 ， 我 们 要 判 
定 其 类 型 就 从 最 里 面 的 那个 圆 括 号 开始 。 最 里 面 的 圆 括 号 中 舍 有 * 号 ， 
也 含有 pArray 对 象 标 识 符 ， 说 明 该 对 象 的 类 别 肯 定 是 一 个 指针 。 然 后 
看 该 圆 括号 的 右边 有 没有 跟 下 标 或 函数 形 参 列表 。 我 们 看 到 ， 这 里 右 

边 紧 跟着 的 古 [3]， 说 明 pArray 对 象 是 一 个 指向 含有 3 个 元 素 的 数组 的 指 
针 ， 那 么 这 一 层 就 结束 了 。 然 后 看 外 面 一 层 ， 这 里 也 是 (*) 的 形式 ， 
其 左边 是 一 个 void 类 型 ， 右 边 是 一 个 (int) 形 参 列表 ， 说 明 它 是 一 个 
指向 返回 类 型 为 void， 市 有 一 个 int 类 型 形 参 的 函数 的 指针 类 型 。 这 公 


一 分 析 之 后 ， 我 们 就 可 以 得 到 pArray 对 象 是 一 个 指向 3 个 元 素 的 数组 的 
8 外， 数组 的 每 个 元 素 是 指向 返回 类 型 为 void， 并 带 有 一 个 int 类 型 形 
参 的 画 数 指针 类 型 。 


例 2: int (* (*pFunc) ” (void) ) [3]。pFunc 对 象 的 类 型 中 也 含有 
* 符 号 ， 并 且 也 含有 圆 括号 。 我 们 仍然 从 最 里 面 的 那 层 圆 括号 开始 分 
析 。 最 里 面 的 圆 括号 中 包含 了 * 符 号 以 及 pFunc 标 识 符 ， 说 明 pFunc 一 定 
是 一 个 指针 。 然 后 看 该 圆 括号 右边 跟着 的 是 (void) ， 它 很 明显 是 一 
个 形 参 列表 ， 表 示 无 任何 形 参 ， 说 明 pFunc 是 一 个 指向 钞 数 的 指针 类 
型 。 最 后 看 外 面 一 层 圆 括号 ， 也 是 (*) 的 样式 ， 其 左边 是 int 类 型 ， 
右边 是 [3]， 说 明 这 古 一 个 指向 int[3] 数 组 的 指针 类 型 。 因 此 ， 我 们 就 可 
以 把 pFunc 的 完整 类 型 给 推 岂 出 来 一 一 它 是 一 个 指 疝 不 仿 任 何 形 参 的 ， 
返回 类 型 为 int (*) [3] 的 函数 的 指针 。 


例 3: void (**array[3]) (int) 。 对 象 array 的 类 型 中 也 包含 了 * 号 
以 及 圆 括号 。 不 过 由 于 这 里 只 有 一 个 圆 括号 ， 所 以 我 们 可 以 直接 对 圆 
括号 里 的 内 容 进 行 分 析 。 这 里 ，array 标 识 符 没 有 与 某 个 * 进 行 捆绑 在 
一 个 圆 括号 中 ( 即 \*array) 这 种 形式 ) ， 它 与 * 号 是 分 开 的 ， 然 后 看 
array 标 识 符 后 面 紧 跟着 [3]， 说 明 它 是 一 个 含有 3 个 元 素 的 数组 。 之 后 
再 看 标识 符 所 在 的 圆 括号 中 其 余 内 容 ， 是 两 个 * 号 ， 也 就 是 (**) ， 再 
看 其 右边 跟着 的 是 (int) ， 说 明 它 是 一 个 指向 函数 指针 的 指针 ， 在 它 
左 侧 看 到 是 一 个 void 类 型 ， 说 明 函 数 返 回 类 型 是 void。 那 么 完整 地 看 


array， 其 类 型 为 一 个 含有 3 个 元 素 的 数组 ， 数 组 的 每 个 元 素 的 类 型 为 
指 癌 返 回 类 型 为 void， 并 带 有 一 个 类 型 为 int 形 参 的 钞 数 的 指针 的 指 
针 。 当 然 ， 像 这 里 的 array 也 可 以 被 声明 为 : void (* ee ) 
(int) Oe i 实 也 容易 分 析 。 

一 来 就 更 能 看 出 array 是 一 个 数组 对 象 ， 然 ee 


了 ， 而 最 外 围 的 void (*) (int) 束 是 array[0] 这 个 指针 所 指向 的 类 
型 。 


从 上 面 3 个 例子 可 以 看 出 ， 对 于 诸如 T (*id) <postfix> 的 声明 而 
言 ，id 束 是 一 个 指针 对 象 ， 而 它 所 指向 的 类 型 即 为 其 圆 括 号 外 围 的 


T<postfix> 类 型 。 
我 们 通过 代码 清单 13-6 来 验证 上 面 所 做 的 类 型 推论 是 否 正 确 。 
代码 清单 13-6 对象 类 型 推断 验证 


#include <stdio.h> 


// 在 全 局 作用 域 声 明 一 个 静态 int 类 型 元 素 的 数组 ， 并 对 它 初始 化 
static int SArray[] = { 1, 2, 3 }; 


// 定义 一 个 返回 类 型 为 void， 带 有 一 个 jnt 类 型 参数 的 静态 函数 fFunc 
static void func(int a) 


printf("a = %d\n", a); 


// 定义 一 个 返回 类 型 为 jnt (*)[3]， 不 带 有 任 一 形 参 的 静态 函数 Fun 
static int (*Fun(void))[3] 
{ 


return &sArray; 


int main(int argc, const char* argv[]) 


/** 先 验证 pArray 对 象 */ 
/7 这 里 先 声 明 一 个 含有 3 个 元 素 的 数组 对 象 arr， 


// 每 个 元 素 的 基 型 为 指 癌 void (int ) 函 数 的 指针 
void (*arr[3])(int) = { &func } 


// 在 文中 已 推断 出 了 pArray 的 类 型 为 指向 一 个 含有 3 个 元 素 的 数组 的 指针 ， 
// 数组 中 每 个 元 素 的 类 型 为 指向 void(int ) 函数 的 指针 
void (*(*pArray)[3])(int) = &arr,; 


// 通过 pArray 指 向 数组 的 指针 来 调用 函数 
pArray[0][0](100); 


/xx 然后 验证 pFunc 对 象 */ 


// PR i dd 该 函数 的 返回 类 型 为 int (*)[3]， 
// 让 任何 
int (*(*pFunc)(void))[3] = &Fun; 


// 通过 pFunc 做 函数 调 
// 由 于 pFunc 所 指 画 数 的 返回 类 型 是 int A )L3], 所 以 pFunc()[9] 则 是 int[3]， 
// 这 里 的 pFunc() [9] 与 (*pFunc() ) 是 等 价 的 

Int *p = pFunc()[9] ， 

printf("Sum is: %d\n", p[0] + p[1] + p[2]); 


/** 最 后 验证 array 对 象 */ 


// array 对 象 类 型 为 含有 3 个 元 素 的 数组 ， 该 数组 的 每 个 元 素 的 类 型 是 void (**)(int )， 
// 即 指向 返 回 类 型 为 void， 带 有 一 个 int 类 型 形 参 的 函数 的 指针 的 指针 
void (** array[3])(int) = { &arr[0] }; 


// 通过 array 数 组 对 象 做 函数 调 
(*array[0])(19 ) ， 


通过 代码 清单 13-6， 通 过 一 些 类 型 相对 简单 的 对 象 为 这 些 复 洒 类 
型 的 对 象 赋值 ， 我 们 就 能 很 快 验证 出 这 些 类 型 确实 如 上 述 所 推断 的 那 
样 。 


上 上述 所 描述 的 一 些 例子 中 对 象 的 类 型 已 经 足够 复杂 了 ， 当 然 我 们 
还 可 以 写 出 更 复 洒 的 类 型 ， 只 要 大 家 掌握 上 面 所 讲 的 关键 点 束 能 比较 
容易 地 判定 某 个 对 象 或 函数 的 类 型 ， 并 且 也 能 自己 写 出 想 要 的 类 型 。 
如 果 各 位 掌握 了 这 部 分 知识 的 话 ， 那 么 可 以 说 基本 已 经 能 够 随意 敬 拆 
C 语 言 了 。 


13.4 _ typedef 类 型 定义 


我 们 上 一 节 介 绍 了 比较 复 洒 的 对 象 类 型 与 贸 数 类 型 。 通 常 来 说 ， 
我 们 看 到 那样 复杂 的 类 型 第 一 感觉 融 是 头晕 想 吐 .…… 因 此 C 语 言 引 入 
了 类 型 定义 ， 可 以 将 复杂 的 类 型 抽象 为 一 个 类 型 标识 符 ， 这 样 我 们 整 
可 以 直接 用 定义 好 的 类 型 标识 符 去 声明 一 个 对 象 或 作为 函数 声明 的 一 
部 分 了 。C 语 言 中 类 型 定义 的 语法 与 声明 一 个 对 象 的 语法 很 类 似 ， 仅 
仅 是 在 最 前 面 加 上 typedef 关 键 字 。 比 如 ， 我 们 要 用 int 类 型 来 定义 一 个 
名 为 INT 的 类 型 ， 那 么 可 以 这 么 写 : typedef int INT; 。 这 里 也 是 需要 
用 分 号 作为 结束 符 的 。 我 们 可 以 看 到 ， 如 果 把 typedef 去 挥 ， 那 么 就 相 
当 于 定义 了 一 个 名 为 INT 的 对 象 。 而 前 面 一 旦 添加 了 typedef， 那 么 INT 
标识 符 束 不 古 一 个 对 象 标 识 符 ， 而 是 一 个 类 型 标识 人 符 了 ，C 语 言 标准 


也 把 类 型 标识 符 称 为 typedef 名 (typedef name) 


typedef 名 与 结构 体 标签 、 联 合体 标签 和 枚 举 标签 一 样 ， 都 属于 用 
户 自 定义 类 型 ， 而 且 typedef 也 可 以 放 在 文件 作用 域 和 语句 块 作用 域 
中 。 当 然 ， 如 果 typedef 定 义 的 是 一 个 可 变 修改 类 型 ， 那 么 它 只 能 放 在 
语句 块 作 用 域 中 。typedef 还 能 舱 套 定义 ， 也 束 是 用 一 个 typedef 名 去 定 
义 另 一 个 类 型 ， 比 如 : typedef INT MYINT; ， 这 里 用 上 述 定义 好 的 
INT 自 定义 类 型 再 定义 了 一 个 MYINT 这 个 类 型 ， 它 与 INT 都 一 样 ， 都 
属于 int 类 型 。 


下 面 我 们 将 分 3 个 部 分 来 描述 typedef 进 行 类 型 定义 的 方式 与 功能 。 
第 1 部 分 将 介绍 typedef 一 般 的 用 法 ， 我 们 如 何 用 它 来 定义 普通 的 对 象 类 
型 以 及 函数 类 型 ， 并 且 如 何 用 typedef 名 去 声明 一 个 对 象 或 一 个 函数 。 
第 2 部 分 我 们 将 描述 typedef 如 何 与 限定 符 相 结合 ， 以 及 相 结合 之 后 限定 
符 究 苋 限定 什么 类 型 。 第 3 部 分 将 介绍 通过 typedef 来 定义 某 个 结构 体 或 


13.4.1 typedef 的 一 般 使 用 


前 面 已 经 描述 了 ， 使 用 typedef 来 做 类 型 定义 时 ， 其 声明 形式 与 声 
明 一 个 对 象 的 形式 非 党 类似， 仅仅 是 在 最 前 面 添 加 typedef 关 键 字 。 而 
定义 好 的 类 型 标识 符 束 相当 于 用 于 定义 该 标识 符 的 那个 类 型 。 与 对 和 象 
声明 一 样 ， 对 同一 类 型 标识 符 的 定义 在 同一 作用 域 中 可 出 现 多 次 ,但 
所 定义 的 类 型 必须 部 相 同 。 男 外 ， 用 typedef 做 类 型 是 义 时 ， 其 声明 只 
能 放 在 文件 作用 域 或 语句 块 作用 域 ， 而 不 能 声明 在 函数 原型 作用 域 
中 。 代 码 清 单 13-7 详 细 描 述 了 typedef 的 一 般 使 用 方式 以 及 一 些 需 要 注 
意 的 地 方 。 


代码 清单 13-7 ”typedef 的 一 般 使 用 方式 


#include <stdio.h> 


// 这 里 使 用 了 声明 列表 形式 ， 将 INT 类 型 标识 符 定义 为 了 int 对 象 类 型 ， 
// 将 FUNC 类 型 标识 符 定义 为 了 int (void ) 函 数 类 型 。 
// 相当 于 : 


// typedef int INT， 
// typedef int FUNC (void); 
typedef int INT, FUNC (void); 


// 这 里 再 次 定义 INT， 仍 然 使 用 类 型 int， 没 
typedef int INT; 


Es 


问题 


// 以 下 语句 将 出 现 编译 错误 。 由 于 INT 标 识 符 已 经 被 定义 为 int， 


// 不 能 用 其 他 与 Int 不同 的 类 型 
typedef short INT; 


定义 INT 


// 这 里 定义 了 一 个 名 为 ARRAY 的 数组 类 型 int[3] 


typedef int ARRAY[3]; 


// 以 下 这 条 语句 声明 了 一 个 名 为 func 的 函数 ， 该 函数 的 类 型 为 FUNC， 即 int (void) 


static FUNC func; 


// 这 里 直接 用 ARRAY 去 声明 一 个 数组 对 象 array，array 的 类 型 为 int[3] 
static ARRAY array 


int main(int argc, const char* argv[]) 


{ 


// 调用 函数 func 
func( ); 


// 对 array 数 组 进行 赋值 
for(int i = 0; i < 3; i++) 
array[i] = i; 


// 这 里 用 已 定义 好 的 类 型 INT 又 声明 了 一 个 PINT 类 型 与 PPINT 类 型 。 
// PINT 类 型 为 nt*， 而 PPINT 类 型 为 jnt** 
typedef INT *PINT, **PPINT; 


// 这 里 用 PINT 声 明了 指针 对 象 p， 并 将 它 初始 化 为 指向 array 数 组 首 个 元 素 。 
// p 的 类 型 为 int* 
PINT p = &array[0]; 


// 这 里 用 PPINT 声 明了 指针 对 象 q， 
PPINT q = &p; 


的 地 址 对 它 初 始 化 。q 的 类 型 为 jnt** 


**q += 10; 
printf("array[0] = %d\n", array[0]); 


*q = NULL; 
if(p == NULL) 
puts("p is null!"),; 


// 这 里 用 PINT* 来 声明 一 个 指针 对 象 r。 由 于 PINT 本 身 是 int* 类 型 ， 
// PL 在 对 象 标识 符 rz 前 再 添加 一 个 * ， 使 得 r 的 类 型 变 为 了 intx* 
PINT *r = &p; 
*r = &array[2]; 
if(*p == array[2]) 

puts("Equal!"); 


// 同样 ， 我 们 这 里 通过 FUNC 类 型 后 面 添加 * 来 声明 一 个 函数 指针 对 象 pFunc 。 
// pFunc 的 类 型 即 为 Int (* ) (void) 

FUNC *pFunc = &func; 

INT a = pFunc(); 

printf("a = %d\n", a); 


// 这 里 需要 注意 的 是 ,， FUNC 类 型 本 身 是 函数 类 型 ， 用 它 声明 的 标识 符 是 一 个 函数 ， 而 不 是 一 个 对 象 。 
// 一 个 函数 标识 符 只 有 在 充当 非 左 值 的 情况 下 才能 隐 式 地 转换 为 指向 函数 的 指针 对 象 。 
// 它 是 不 允许 作为 左 值 的 ! 所 以 以 下 语句 是 错 误 的 

FUNC aFunc = func,; 


// 同样 ， 我们 也 可 以 在 ARRAY 类 型 后 面 添 加 * 来 声明 一 个 指向 数组 的 指针 对 象 pArray 


ARRAY *pArray = &array 
printf("array[1] = %d\n", pArray[0][1]); 


// 类 型 定义 与 对 象 声 明 一 样 ，* 在 不 同 的 位 置 所 表达 的 类 型 语义 有 所 不 同 ， 
// 这 里 ARRAY_PTR 的 类 型 为 jnt*[3] 
typedef INT* ARRAY_PTR[3]; 


// 这 里 PARRAY 的 类 型 为 nt (*)[3] 
typedef INT (*PARRAY)[3]; 


ARRAY_PTR array2 = { &a, p }; 
printf("The value is: %d\n", *array2[0] + array2[1][0] )， 


PARRAY pArray2 = &array; 
if(pArray == pArray2) 
puts("OK!"); 


// 我 们 这 里 要 注意 的 是 ， 定 义 一 个 函数 必须 使 用 完整 的 函数 原型 ， 而 不 能 使 用 类 型 定义 的 类 型 标识 符 
static int func(void) 


A 


printf("%s is called!i\n", _ func_  ); 
return 100; 
} 


代码 清单 13-7 展 示 了 typedef 进 行 类 型 定义 的 一 般 用 法 。 我 们 从 中 
可 以 看 到 ， 用 typedef 来 定义 一 个 类 型 标识 符 的 方式 与 声明 一 个 对 象 的 
方式 相当 类 似 。 此 外 ， 用 typedef 定 义 好 的 一 个 类 型 标识 符 可 以 再 次 用 
于 定义 其 他 类 型 ， 并 且 可 以 随意 与 * 叶 、 下 标 与 形 参 列表 相 结合 ， 构 成 
种 类 丰富 的 指针 类 型 、 数 组 类 型 以 及 函数 类 型 。 用 了 类 型 定义 之 后 ， 
原本 像 指 癌 男 数 的 指针 、 指 同 数 组 的 指针 等 类 型 项 刻 间 就 变 得 简单 多 
了 ， 这 是 C 语 言 对 类 型 的 一 种 抽象 ， 尤 其 用 于 实际 项 目的 开发 过 程 中 
还 古 比 较 有 用 的 。 这 可 以 使 得 底层 库 的 实现 者 将 一 些 复 洒 的 类 型 抽象 
掉 ， 使 得 上 层 开 发 人 员 不 必 去 关心 某 个 类 型 标识 符 具 体征 哪 种 类 型 ， 
而 只 要 适当 使 用 即 可 。 


另外 ， 大 家 还 需要 注意 的 是 ，typedef 定 义 好 的 类 型 标识 符 是 属于 
类 型 ， 所 以 我 们 不 能 用 存储 类 说 明 符 去 修饰 类 型 标识 符 ， 而 类 型 标识 


符 本 吴 也 没有 连接 这 一 概念 ， 整 个 类 型 系统 也 不 存在 存储 类 限定 的 说 
法 。 因 此 存储 类 说 明 符 只 能 用 于 修饰 对 象 与 函数 ， 表 示 该 对 象 或 函数 
所 具有 的 连接 以 及 存储 属性 和 生命 周期 。 


我 们 之 前 也 谈 到 宏 可 以 用 来 预定 义 某 个 类 型 ， 那 么 宏 与 typedef 在 
用 于 类 型 定义 时 有 哪些 差异 呢 ? 


目 先 ，typedef 可 以 定义 几乎 所 有 类 型 ， 比 如 指向 函数 的 指针 类 
型 、 指 向 数组 的 指针 类 型 等 ， 而 这 一 点 宏 是 做 不 到 的 。 


其 次 ， 宏 用 来 做 类 型 定义 时 ， 我 们 可 以 在 任何 地 方 通过 #undef 去 
取消 当前 的 宏 定 义 ， 将 当前 宏 兰 换 成 男 一 种 类 型 ，typedef 则 无 法 实现 
取消 定义 的 处 理 。 


最 后 ， 宏 与 类 型 定义 所 受 影响 的 作用 域 不 一 样 。 宏 完全 属于 文件 
作用 域 (更 确切 地 说 ， 是 当前 整个 翻译 单元 ， 不 受 语句 块 作用 域 的 
影响， 而 typedef 定 义 的 类 型 则 具有 文件 作用 域 或 语句 块 作用 域 。 当 
然 ， 宏 与 类 型 定义 在 本 质 上 的 不 同 就 是 ， 宏 属于 预 处 理 ， 独 立 于 C 源 
代码 的 正式 编译 ， 而 类 型 定义 则 是 在 编译 期 间 处 理 的 。 


13.4.2 typedef 与 类 型 限定 符 相 结合 的 使 用 


来 描述 typedef 的 使 用 。 


目 完 ， 用 typedef 定 义 的 类 型 标识 符 本 和 喘 可 以 用 类 型 限定 符 进 行 修 
饰 。 其 次 ， 在 typedef 定 义 中 ， 我 们 可 以 将 类 型 限定 符 与 类 型 名 组 合 在 
一 起 来 定义 某 个 类 型 。 如 果 在 用 typedef 进 行 类 型 定义 的 过 程 中 已 经 含 
有 了 某 个 类 型 限定 符 ， 比 如 const， 那 么 在 用 该 定义 的 类 型 标识 符 去 声 
明 某 个 对 象 时 也 伴随 着 同样 的 类 型 限定 符 ， 此 时 不 会 引发 类 型 冲突 ， 
见 如 下 代码 片段 所 示 。 


typedef const int CINT; 
CINT const a = 10，; 


上 述 代码 片段 中 ， 我 们 用 const int 来 定义 了 一 个 类 型 CINT， 然 后 
再 用 CINT 来 声明 了 一 个 常量 对 象 a。 这 里 我 们 看 到 ， 在 用 CINT 声 明 对 
象 a 的 时 候 ， 还 伴随 着 一 个 const 类 型 限定 符 ， 此 时 编译 器 不 会 报错 ， 
也 不 会 有 警告 ， 这 条 声明 语句 仍然 有 效 ， 并 且 对 象 a 是 一 个 int 类 型 的 常 


量 ， 即 const int 类 型 。 


当 用 typedef 定 义 了 一 个 指针 类 型 之 后 ， 当 它 与 类 型 限定 符 相 结合 
时 究竟 是 什么 类 型 呢 ? 比如 : 


typedef int *PINT; 
const PINT p; 


这 里 ，PINT 类 型 是 一 个 完整 的 int* 类 型 ， 随 后 我 们 用 PINT 类 型 去 
声明 一 个 指针 对 象 p， 并 且 在 PINT 之 前 添加 了 const 限 定 符 ， 那 么 这 时 
候 ，p 究 竟 是 什么 类 型 呢 ? 我 们 在 第 12 章 中 已 经 讲 过 ， 当 类 型 限定 符 限 
定 一 个 类 型 时 ， 如 果 该 类 型 是 一 个 指针 类 型 ， 那 么 看 它 与 * 号 之 间 的 位 
置 。 我 们 在 这 个 代码 片段 中 看 到 ，PINT 就 是 指 代 int* 类 型 ， 根 据 之 前 
的 判定 方式 ， 似 乎 p 应 该 是 const int* 类 型 。 然 而 ， 这 里 的 PINT 是 直接 
将 it 与 * 号 绑 定 在 一 起 的 ， 并 且 从 整个 对 象 声 明 上 来 看 ， 这 里 就 出 现 
了 const 限 定 符 与 CINT 类 型 说 明 符 这 两 个 声明 说 明 符 ， 所 以 这 束 意 味 着 
这 里 的 const 限 定 符 限定 的 是 完整 的 PINT 类 型 ， 即 int*， 所 以 等 同 于 
PINT const p; ， 也 就 相当 于 int*constp; 了 。 


我 们 在 第 12 革 中 已 有 所 描述 ， 对 于 C 语 言 初 学 者 来 说 ， 我 们 在 对 
一 个 合 有 类 型 限定 符 的 对 和 象 进行 声明 时 ， 尽 量 将 类 型 限定 符 写 在 所 限 
定 类 型 的 后 面 ， 这 样 更 容易 看 出 类 型 限定 符 修 所 的 完 竟 是 什么 类 型 ， 
并 且 也 不 容易 搞 混 。 代 码 清单 13-8 详 细 描述 了 typedef 定 义 的 类 型 标识 
符 与 类 型 限定 符 相 结合 的 使 用 。 


代码 清单 13-8 typedef 类 型 名 与 类 型 限定 符 的 结合 


#include <stdio.h> 


int main(int argc, const char* argv[]) 


// 这 里 定义 了 类 型 PINT， 其 类 型 为 int* 
// 该 定义 与 typedef int* PINT; 等 同 
typedef int (*PINT); 


int a = 0; 


// 用 PINT 类 型 声明 了 一 个 指针 对 象 p， 并 初始 化 为 指向 对 象 a 的 地 址 


const PINT p = &a; 


// 以 下 这 条 语句 错误 。 由 于 p 是 int * const 类 型 ，p 的 值 不 能 被 修改 
p = NULL; 


“p = 10; // 这 条 语句 OK 
printf("a = %d\n", a); 


// 将 CPINT 定 义 为 const int * 类 型 
typedef const int *CPINT; 


// 这 里 用 CPINT 类 型 声明 了 指针 对 象 q， 
// 由 于 这 里 还 用 了 限定 符 const， 因 此 q 的 类 型 为 const int* const 
const CPINT q = &a,; 


// 以 下 两 条 语句 均 不 合法 
*q = 10; 
q = NULL; 


// 这 里 将 PCINT 定 义 为 int * const 类 型 
typedef int * const PCINT; 


// 这 里 用 PCINT 声 明了 指针 对 象 r， 这 里 在 声明 中 也 用 了 const 限 定 符 ， 
// "的 类 型 仍然 为 nt * const 

const PCINT r = &a; 

*r += 10; // OK 

r = NULL; 不 合法 


13.4.3 ”用 typedef 来 定义 结构 体 与 联合 体 的 类 型 


我 们 之 前 提 到 过 ， 用 typedef 定 义 的 一 个 类 型 能 起 到 抽象 具体 类 型 
的 作用 。 这 一 点 我 们 在 实际 项 目 工程 中 会 比较 多 见 ， 比 如 我 们 将 一 个 
描述 写 形 位 置 与 宽 高 的 结构 体 定 义 为 Rect， 此 时 上 层 应 用 开发 者 无 需 
知道 Rect 究 葛 古 一 个 结构 体 还 是 联合 体 或 菏 些 类 型 的 组 合 ， 而 是 直接 
根据 文档 中 的 用 法 去 使 用 即 可 。 我 们 使 用 typedef 也 可 对 枚 举 、 结 构 体 
以 及 联合 体 做 类 型 别名 的 抽象 。 当 我 们 用 typedef 去 定义 某 个 枚 举 、 结 
构 体 或 联合 体 的 一 个 抽象 类 型 时 ， 那 么 用 定义 好 的 类 型 标识 符 去 声明 
一 个 对 象 时 ，enum、struct 以 及 union 关 键 字 必 须 缺 省 。 如 果 不 缺 省 ， 


那么 编译 器 会 根据 这 些 类 型 关键 字 去 查找 相应 的 类 型 。 比 如 ， 如 果 
有 “typedef struct Test{int a，b; }TEST; ”， 那 么 倘 耕 我 们 这 么 声明 一 
个 Test 结 构 体 对 象 “struct TEST t; ”， 那 么 编译 右 束 会 报错 : “变量 t 具 
有 不 完整 类 型 ‘struct TEST’””。 所 以 ， 我 们 要 么 用 “struct Test t; ”要 人 么 
用 “TESTt; ”进行 声明 。 


此 外 ， 我 们 一 般 也 会 用 typedef 将 一 个 匿名 枚 举 、 结 构 体 或 联合 体 
来 定义 为 某 一 抽象 类 型 。 代 码 清单 13-9 给 出 了 更 多 的 用 法 。 


代码 清单 13-9 ”typedef 用 于 定义 一 个 枚 举 、 结 构 体 和 联合 体 的 情 
况 


#include <stdio.h> 


// 通过 typedef 将 结构 体 MyRect 定 义 为 RECT 
typedef struct MyRect 


struct 


float x, y; 
} positon; 


struct 
float width，height 


} size; 
} RECT; 


// 这 里 将 一 个 匿名 枚 举 类 型 定义 为 TRAFFIC_LIGHT 
typedef enum 
{ 


RED_LIGHT, 

YELLOW_LIGHT, 

GREEN_LIGHT 
} TRAFFIC_LIGHT ; 


我 们 可 以 先 typedef 定 义 好 一 个 类 型 ， | | 
// 尽管 此 时 union Vertex_Attr 是 一 个 不 完整 类 型 ， 但 是 不 影响 类 型 定义 
typedef union Vertex_Attr VERTEX_ATTR; 


上 -| 


// 这 里 直接 定义 Vertex_Attr 类 型 即 可 ，typedef 可 省 
union Vertex_Attr 


float position[4]; 


float color[4]; 
}; 


// 这 里 用 typedef 先 定义 了 NODE 类 型 与 PNODE 类 型 
typedef struct Node NODE, *PNODE; 


struct Node 


int data; 
// 由 于 之 前 已 经 定义 好 了 PNODE 类 型 ， 因 此 这 里 可 直接 使 用 。 
// 1ink 的 类 型 为 struct Node* 
PNODE link; 
}; 
int main(int argc, const char* argv[]) 
{ 


// 这 里 我 们 用 RECT 去 声明 对 象 rect 时 ， 前 面 不 能 添加 struct 关 键 字 
RECT rect = { 10.0f, 20.0f, 50.0f, 60.0f }; 


// 同样 ， 这 里 TRAFFIC_LIGHT 前 不 能 添加 enum 
TRAFFIC_LIGHT light = GREEN_LIGHT; 


// 这 里 的 VERTEX_ATTR 前 不 能 添加 union 
VERTEX_ATTR vertexColor = { .color = {0.1f, 0.9f, 0.1f, 1.0f} }; 


printf("The value is: %f\n", 
rect.positon.y + light + vertexColor.color[1]); 


// 我 们 用 NODE 类 型 声明 了 一 个 node_1ist 数 组 对 象 
// 下 面 我 们 做 一 个 简单 的 线性 单 链表 的 搜索 算法 
NODE node_list[3]; 


// 先 为 node_1ist 数 组 的 各 个 成 员 进行 初始 化 
node_list[0].data 二 
node_1list[0].1link &node_list[1]， 


node_list[1].data 
node_1list[1].1link 


2; 
&node_1list[2]; 


node_list[2].data 
node_1list[2].1link 


// 然后 我 们 声明 对 象 p 作 为 线性 列表 的 表 头 节点 
PNODE p; 


// 下 面 我 们 找到 data 值 为 3 的 那个 节点 
for(p = node_list; p != NULL; p = p->link) 


3) 
NULL， 


if(p->data == 3) 


puts("The node is found!"),; 
break; 


} 


if(p == NULL) 
puts("Node not found!"); 


从 代码 清单 13-9 中 我 们 可 以 看 到 ，typedef 用 于 定义 一 个 抽象 的 枚 
举 、 结 构 体 和 联合 体 类 型 时 显得 十 分 灵活 。 当 然 ， 这 里 面 还 没 展示 出 
与 类 型 限定 符 的 结合 ， 但 原理 都 一 样 ， 只 需要 在 typedef 后 面 或 类 型 标 
识 符 前 添加 即 可 ， 存 在 * 号 的 情况 下 则 按 自己 的 需要 摆 放 好 位 置 。 我 们 
还 看 到 了 ， 在 使 用 typedef 时 ， 如 果 此 时 用 来 定义 类 型 的 枚 举 、 结 构 体 
或 联合 体 本 身 尚未 被 定义 ， 那 也 不 影响 类 型 定义 ， 稍 后 可 以 补 上 对 这 


些 具 体 类 型 的 定义 。 


13.5 ”本章 小 结 


本 章 我 们 更 深入 地 讲解 了 C 语 言 的 类 型 系统 ， 并 且 详 细 地 介绍 了 
对 象 与 函数 的 声明 文法 。 通 过 对 本 章 的 学 习 ， 各 位 对 C 语 言 的 设计 理 
念 ， 万 其 是 类 型 系统 的 设计 上 会 有 更 深刻 的 认识 。 本 章 最 后 也 描述 了 
C 语 言 中 的 类 型 定义 使 用 方法 以 及 注意 事项 。 各 位 如 条 将 本 章 学 习 透 
彻 ， 那 么 可 以 说 基本 上 天 路 入 了 C 语 言 大 师 的 行列 了 。 


至 此 ，C 语 言 标准 中 的 大 部 分 语法 部 讲解 得 差不多 了 ， 下 一 章 将 
主要 接 述 C11 标 准 新 引入 的 泛 型 表达 式 与 静态 断言 。 


第 14 章 ”C11 标准 中 的 表达 式 、 左 值 与 求 
值 顺 序 


C11 标 准 细 分 了 17 种 表达 式 ， 而 这 17 种 表达 式 中 有 相互 包含 的 情 
况 。 我 们 先 大 致 看 一 下 这 17 种 表达 式 : 


1) 基本 表达 式 : 包括 了 标识 符 、 常 量 、 字 符 串 字面 量 、 圆 括号 表 
达 式 ( 即 《表达 式 ) 这 种 形式 ) ， 以 及 泛 型 选择 表达 式 。14.2 廊 将 详 
细 介 绍 C11 标 准 新 引入 的 泛 型 选择 表达 式 。 


2) 后 级 表达 式 ， 包括 了 基本 表达 式 、 带 有 下 标的 表达 式 (比如 : 
array[10]) 、 画 数 调用 〈 比 如 : Func (10) ) 、 结 构 体 或 联合 体 的 成 
员 访 问 (比如 : obj.a 或 pObj->a) 、 后 级 ++ 和 --、 匿 名 结构 体 或 联合 体 
的 初始 化 列表 (比如 : (struct S) {.a=10, .b=20}) 。 


3) 单 目 表达 式 ， 包括 了 后 缀 表达 式 、 前 缀 ++ 和 --、 单 目 操作 符 结 
合 投 射 表达 式 (比如 : - (int) 10.5) 、sizeof 表 达 式 、_Alignof 表 达 
式 。 这 里 要 注意 的 是 ，C 语 言 中 所 规定 的 单 目 操作 符 只 有 &、*、 
、-、~、! ， 前 级 ++ 和 --。 这 里 的 & 表 示 地 址 操作 符 ， 而 不 是 按 位 
与 ; 这 里 的 * 表 示 间 接 操作 ， 而 不 是 乘法 计算 ; 这 里 的 + 和 -表示 正 负 
号 ， 而 不 是 加 和 减 。 


十 


4) 投射 表达 式 : 包括 了 单 目 表达 式 、 (类 型 名 ) 投射 表达 式 。 比 
如 (int) 10.5。 


5) 乘法 表达 式 : 包括 了 投射 表达 式 ， 带 有 乘法 操作 符 、 除 法 操作 
符 或 求 模 操作 符 的 表达 式 (比如 : 3*5、6/2、7%3) 。 乘 法 表达 式 
中 ， 如 采 含 有 乘法 操作 符 、 除 法 操作 符 或 求 模 操作 符 ， 那 么 操作 符 左 
边 是 乘法 表达 式 ， 厂 边 是 投射 表达 式 。 


6) 加 法 表达 式 : 包括 了 乘法 表达 式 ， 带 有 加 法 操作 符 或 减法 操作 
符 的 表达 式 。 如 采 加 法 表达 式 中 舍 有 加 法 操作 符 或 减法 操作 符 ， 那 么 
操作 符 左 边 为 加 法 表达 式 ， 右 边 为 乘法 表达 式 。 

7) 移 位 表达 式 : 包括 了 加 法 表达 式 ， 带 有 左 移 或 右 移 的 表达 式 。 


如 果 移 位 表达 式 中 含有 左 移 或 右 移 操作 符 ， 那 么 操作 符 左边 为 移 位 表 
达 式 ， 右 边 为 加 法 表达 式 。 


8) 关系 表达 式 : 包括 了 移 位 表达 式 ， 带 有 小 于 、 大 于 、 人 小 于 等 
于 、 大 于 等 于 操作 符 的 表达 式 。 如 有 果 天 系 表达 式 中 含有 小 于 、 大 于 、 
大 于 等 于 或 小 于 等 于 操作 符 ， 那 么 操作 符 左边 为 天 系 表 达 式 ， 石 边 为 
移 位 表达 式 。 


9) 相等 表达 式 : 包括 了 关系 表达 式 ， 带 有 == 或 ! = 操作 符 的 表达 
式 。 如 果 相 等 表达 式 中 带 有 == 或 ! = 操作 符 ， 那 么 操作 符 左边 为 相等 
表达 式 ， 右 边 为 天 系 表达 式 。 


10) 按 位 与 表达 式 : 包括 了 相等 表达 式 ， 含 有 按 位 与 操作 符 & 的 
表达 式 。 如 采 按 位 与 表达 式 中 含有 按 位 与 操作 符 ， 那 么 操作 符 左 边 为 
按 位 与 表达 式 ， 右 边 为 相等 表达 式 。 


11) 按 位 异 或 表达 式 ， 包括 了 按 位 与 表达 式 ， 带 有 按 位 异 或 操作 
符 ^ 的 表达 式 。 如 有 果 按 位 异 或 表达 式 中 含有 按 位 异 或 操作 符 ， 那 么 操作 
符 左边 是 按 位 异 或 表达 式 ， 操 作 符 右边 是 按 位 与 表达 式 。 


YY 


12) 按 位 或 表达 式 : 包括 了 按 位 异 或 表达 式 ， 带 有 按 位 或 操作 符 
的 表达 式 。 如 末 按 位 或 表达 式 带 有 按 位 或 操作 符 ， 那 么 操作 符 左边 十 
按 位 或 表达 式 ， 右 边 是 按 位 异 或 表达 式 。 


13) 逻辑 与 表达 式 : 包括 了 按 位 或 表达 式 ， 带 有 逮 辑 与 操作 符 
&& 的 表达 式 。 如 有 果 逮 辑 与 表达 式 中 市 有 逻辑 与 操作 符 ， 那 么 操作 符 
左边 为 逻辑 与 表达 了 式 ， 右 边 为 按 位 或 表达 式 。 

14) 逻辑 或 表达 式 : 包括 了 逻辑 与 表达 式 ， 带 有 逮 辑 或 操作 符 | 的 
表达 式 。 如 来 逻辑 或 表达 式 中 带 有 逻辑 或 操作 符 ， 那 么 操作 符 左边 为 
逻辑 或 表达 式 ， 右 边 为 逻辑 与 表达 式 。 

15) 条 件 表达 式 : 包括 了 逻辑 或 表达 式 ，? : 结合 的 三 目 表 达 
趟 "三 目 和 表达 式 的 形式 为 ， 逻 得 或 表达 趟 ? 表达 式 : 条 件 朋 达 翅 。 


Os 这 里 对 条 件 表达 式 的 描述 古 C11 标 准 中 的 描述 ， 而 我 
们 平时 在 使 用 条 件 表达 式 的 时 候 应 该 参考 8.2 节 中 描述 的 形式 ， 也 就 是 
将 这 里 ? 之 前 的 表达 式 视 作 为 布尔 表达 式 。 


16) 赋值 表达 式 : 包括 了 条 件 表达 式 ， 以 及 这 种 形式 的 表达 式 : 
单 目 表 达 式 赋值 操作 符 赋 值 表达 式 。 赋 值 操 作 符 为 以 下 操作 符 : =、 


* 二 、/=、%=、+=、-=、 <<=、>>=、&=、 人 全、|=° 


17) 表达 式 : 这 里 的 表达 式 即 为 基本 表达 式 中 圆 括号 里 的 那个 表 
达 式 。 它 包括 了 赋值 表达 式 ， 以 及 这 种 形式 的 表达 式 ， 表达 式 ， 赋 值 


表达 式 。 这 也 束 是 我 们 在 8.1 节 中 所 描述 的 逗号 表达 式 。 


我 们 可 以 看 到 ， 表 达 式 的 排列 顺序 表明 了 表达 式 所 亢 盖 操作 符 的 
计算 优 移 级 。 这 里 优先 级 最 高 的 显然 束 是 圆 括号 了 ， 优 先 级 最 低 的 则 
征 逗 号 。 这 里 各 位 要 着 重 注意 的 是 ， 按 位 操作 符 的 优先 级 小 于 关系 操 
作 符 ， 因 此 我 们 在 使 用 条 件 判 定语 句 的 时 候 一 定 要 给 按 位 操作 符 加 上 
圆 括 号 。 如 代码 请 单 14-1 所 示 。 


代码 清单 14-1 注意 按 位 操作 符 与 关系 操作 符 的 优先 级 


#include <stdio.h> 
#include <stdbool.h> 


int main(int argc, const char* argv[]) 


int a = 10; 


// 这 里 的 条 件 判断 是 真 ， 后 面 会 输出 OK 
if((a & 1) == 0) 
puts("OK"); 


// 这 里 的 if 语 句 中 相当 于 : 
// a & (1 == 0)， 所 以 先 计算 1 == 0 这 个 相等 表达 式 
// 然后 计算 a & false， 所 以 整个 表达 式 的 结果 为 false 
if(a & 1 == 0) 

putSs("0oops")， 


bool result =a & 1 == 0' 
printf("result = %d\n", result); 


14.1 销量 表达 式 


营 量 表达 式 是 指 该 表达 式 在 编译 期 间 束 能 够 和 被 计算 出 来 ， 而 不 需 
要 生成 相应 运行 时 代 吗 。C 语 言 的 常量 表达 式 是 在 “条 件 表达 式 ” 这 个 
层级 ， 也 就 古 说 赋值 表达 式 不 能 作为 一 个 常量 表达 式 ， 当 然 并 不 是 所 
有 在 条 件 表达 式 这 一 层级 的 表达 式 都 能 作为 彰 量 表达 式 。 和 量 表达 式 
不 应 该 含有 赂 值 、 弟 增 、 递 碱 、 函 数 调用 以 及 过 号 操作 从， 除非 它 们 
作为 包含 在 一 个 不 被 计 算 的 子 表达 式 中 (比如 包含 在 sizeof 控 作 数 
a 


对 于 初始 化 万 中 的 利 量 表达 式 可 以 有 更 宽松 的 限定 ， 它 可 以 十 : 


3) 一 个 地 址 常量 ， 


a 


一 个 完整 对 象 类 型 的 地 址 币 量 加 上 或 减 去 一 个 整数 音量 所 构成 
亲政 二 这 取 


4 


一 个 算术 第 


量 
整数 闻 量 、 浮 点 稼 量 、 字 符 癌 量 、 不 侣 有 可 变 修 改 类 型 的 sizeof 表 达 


式 ， 以 及 _Alignof 表 达 式 。 而 在 一 个 算术 常量 表达 式 中 的 投射 操作 也 
应 该 只 是 将 一 种 算术 类 型 转换 为 另 一 个 算术 类 型 ， 除 非 作 为 sizeof 与 
Alignof 的 操作 数 。 


我 们 要 判定 一 个 表达 陈 是 否 为 钊 量 表达 式 其 实 比较 简单 ， 我 们 对 
一 个 全 局 对 象 进行 初始 化 ， 如 果 能 通过 编译 ， 那 么 为 它 初 始 化 的 表达 
式 束 基 本 是 一 个 和 量 表达 式 ， 否 则 它 束 不 是 一 个 常量 表达 式 。 代 码 清 
单 14-2 展 示 了 判定 常量 表达 式 的 方法 。 


代码 清单 14-2 常量 表达 式 的 判定 


#include <stdio.h> 
#include <stdint.h> 

/ 这 里 声明 了 个 静态 变量 对 象 a， 这 里 的 100 是 一 个 常量 表达 式 
static int a = 100; 


// 由 于 静态 文件 作用 域 对 象 a 不 是 一 个 常量 ， 所 以 这 里 的 a 不 是 一 个 常量 表达 式 。 
// 这 条 语句 会 引发 编译 错误 一 初始 化 器 元 业 不 是 一个 编译 人 常量 
static int b = a; 


// 这 里 用 const 声 明了 一 个 常量 对 象 c， 这 里 的 (200 - 100) / 2 是 一 个 常量 表达 式 
static const int c = (200 - 100) / 2; 


// 对 象 c 是 一 个 常量 ， 所 以 这 里 的 (c + 2) << 1 是 一 个 常量 表达 式 
static const int64 t d = (sizeof(c) + 2) << 1; 


// 整个 (sizeof(d) 
// 是 一 个 常量 表达 式 
static int e = (S 


> sizeof(c))? sizeof(d) + 1 : sizeof(c) - 1 表达 式 ， 


izeof(d) > sizeof(c))? sizeof(d) + 1 : sizeof(c) - 1; 


// 如 果 一 个 常量 表达 ey ee 那么 它 可 以 是 一 个 地 址 常量 。 


// 这 里 ，&e 这 个 表达 式 就 是 一 个 地 址 常量 
int *p = &e' 


// 在 6CC 与 Clang 中 ， 被 const 修 饰 的 一 个 常量 对 象 也 能 作为 初始 化 器 的 一 个 常量 表达 式 ， 

// 但 在 MSVC 中 却 不 被 允许 ， C 语 言 标 能 没有 指定 const 修 饰 的 对 象 是否 能 作为 一 个 个 常量 表达 式 ， 
// 但 c 语 言 标准 声明 了 ， 人 允许 C 语 言 实现 接受 其 他 形式 的 常量 表达 式 

static int64 t maybeError =c + d; 


昌 训 于 


int main(int argc, const char* argv[]) 


printf("a = %d, c = %d, d = %]lild, e = %d\n", a, c, d, e); 


代码 清单 14-2 列 举 了 一 些 能 作为 常量 表达 式 的 表达 式 形 式 。 对 于 
常量 表达 式 而 言 ， 比 如 上 述 的 〈200-100) /2， 在 实际 编译 后 的 二 进 制 
代码 中 不 会 包含 整个 计算 表达 式 的 过 程 ， 而 仅仅 是 一 个 计算 结果 ， 即 
50。 如 果 在 函数 中 出 现 像 int a= (200-100) /2; 这 种 语句 ， 最 终 整 条 语 
名 对 应 的 指令 可 能 仅仅 束 是 “mov reg，50”， 假 设 reg 表 示 变 量 a 所 在 的 
寄存 器 ， 而 不 会 有 减法 、 除 法 等 指令 出 现 ， 这 些 计 算 全 都 由 编译 器 负 
责 计算 。 


当然 ， 一 些 编译 需 可 能 会 根据 上 下 文 对 代码 进行 优化 。 比 如 像 int 
a=100; 和 int b=a+50; 这 两 条 语句 中 ，a 和 b 都 是 变量 ， 但 是 在 编译 int 
b=a+50; 这 句 时 编译 器 可 能 会 直接 将 它 编译 为 : mov reg，150， 假 设 
reg 表 示 变 量 b 所 用 的 寄存 器 。 然 而 在 C 语 言语 法 上 ，a+50 仍 然 不 属于 常 


14.2” 沁 型 选择 表达 式 


泛 型 选择 表达 式 是 C11 标 准 新 引入 的 一 个 重大 语法 特性 。 它 可 以 
使 得 C 语 言 使 用 轻 量 级 的 泛 型 机 制 ， 其 表达 形式 如 下 : 


_Generic (赋值 表达 式 ， 泛 型 关联 列表 ) 


这 里 的 “赋值 表达 式 ? 其 实 融 是 我 们 在 本 章 开 头 所 列 出 的 第 16 条 表 
达 式 ， 也 十 范围 第 二 大 的 。 而 泛 型 关联 列表 的 形式 是 一 组 用 喜 号 分 隔 
的 类 型 与 表达 式 相 联结 的 表达 式 ， 形 式 为 : 


类 型 名 : 赋值 表达 式 。 


整个 泛 型 选择 表达 式 的 语义 为 : C 语 言 实现 先 获取 最 左边 的 赋值 
表达 式 的 类 型 ， 这 里 要 注意 的 是 ， 此 获取 类 型 的 动作 与 sizeof 表 达 式 一 
样 ， 仅 获取 类 型 而 不 对 表达 式 做 计算 ， 也 不 会 生成 相关 的 运行 时 代 
码 ， 然 后 将 获取 到 的 类 型 与 沁 型 天 联 列表 中 每 一 个 “类 型 名 ”部 分 进行 
比较 ， 如 果 两 者 兼容 则 选择 该 “类 型 名 ”所 对 应 的 赋值 表达 式 作 为 整个 
泛 型 表达 式 的 计算 结果 ， 否 则 跳 过 当前 的 泛 型 关联， 壬 试 匹配 下 一 
条 。 其 中 ， 类 型 名 部 分 还 可 以 用 default 来 表示 当 汉 型 关联 列表 中 没 找 
到 与 最 左边 的 赋值 表达 式 的 类 型 相 匹配 的 类 型 时 所 选 出 的 表达 式 。 


代码 清单 14-3 列 举 了 泛 型 选择 表达 
项 。 


代码 清单 14-3 


#include <stdio.h> 


int main(int argc, const char* argv[]) 


式 的 基本 用 法 以 及 一 些 注意 事 


泛 型 选择 表达 式 的 基本 使 用 


{ 

// 这 里 列举 了 一 个 简单 的 泛 型 选择 表达 式 。 
// 该 表达 式 中 ， 对 表达 式 109 进 行 获取 类 型 ， 然 后 对 后 面 的 泛 型 关联 进行 匹配 。 
// 我 们 知道 199 属 于 int 类 型 ， 因 此 最 终 整个 泛 型 选择 表达 式 的 结果 为 表达 式 1。 
// 这 条 语句 在 编译 完成 后 其 实 就 相当 于 : int a = 1; 
int a = _Generic(100, float:-1, int:1, default:0); 
printf("a = %d\n", a); // 这 里 输出 : a = 1 
// 在 这 条 泛 型 选择 表达 式 中 ， 
// (++ay a + 1,5f) 这 一 逗号 表达 式 最 终 计算 出 的 类 型 是 float， 
// 由 于 泛 型 选择 表达 式 中 最 左边 型 匹配 源 的 赋值 表达 式 不 被 计算 ， 
// 所 以 这 里 的 ++a 没 有 任何 效果 
a = _Generic((++a, a + 1.5f), int:a + 10, float:a + 100, 

double:a + 1000, default: a); 
printf("second a = %d\n", a); // 这 里 输出 : a = 101 
// 尽管 在 一 般 赋 值 表达 式 中 ，float 能 隐 式 地 转换 为 double 类 型 ， 
// 但 是 在 泛 型 选择 表达 式 中 ， 类 型 匹配 是 相当 严格 的 ! a + 1.5f 是 float 类 型 ， 
// 那么 由 于 在 这 里 找 不 到 float 类 型 ， 
// C 语 言 实现 就 会 选择 default 中 的 表 达 式 作为 整个 泛 型 选择 表达 式 的 结果 。 
// 这 条 语句 就 相当 于 a= a 实 就 如 同一 条 空 语 名 
a = _Generic(a + 1.5f, int:a + 10, long:a + 100, 

double:a + 1000, default: a); 
printf("third a = %d\n", a); // 这 里 仍然 输出 : a = 101 
const char *output = "none"; 
// 当 我 们 的 匹配 源 表达 式 是 一 个 字符 串 字面 量 的 时 候 必 须 注意 ， 
// C 语 言 标准 中 是 将 字符 串 字 面 量 视 作为 char* 类 型 ， 但 有 些 C 语 言 实 现在 匹配 泛 型 关联 的 时 候 ， 
// 可 能 仍然 会 将 字符 串 类 型 设 定 为 const char [N] ，N 表 示 字 符 串 中 字符 个 数 再 加 一 个 八 6 结束 符 。 
// 因此 使 用 时 应 当 小 心 ， 尽 量 使 用 投射 操作 做 显 式 的 类 型 转换 
output = _Generic("abc", const char* "const char*", char* "char*", 

const char[4] : "const char[4]", 
char[4] "char[4]"); 

// 我 们 尝试 下 面 这 条 语句 ， 
// 会 看 到 当前 编译 器 在 做 编译 报错 时 仍然 会 把 "abc" 作 为 char[4] 或 const char[4] 类 型 
"abc" = 100; 


printf("output is: %s\n", output); 
struct Point { int x, y; }; 
struct Size { int width, height; 
Struct Point p = { }; 

y 


结构 体 的 类 型 匹配 也 同样 如 此 
output = _Generic(p, struct Point:"Poi 
struct Size:"Size", 
printf("p is a %s\n", output); 


}; 


nt", 
default:"none"); 


// 下 面 我 们 通过 投射 操作 加 逗号 表达 式 作 为 泛 型 关联 ， 分 别 给 X、y 两 个 对 象 进行 初始 化 。 
// 我 们 在 每 个 泛 型 关联 中 的 表达 式 的 前 面 加 上 (void ) ， 表示 整个 表达 式 为 void 表达 式 8 
// 要 注意 ， 如 果 一 个 泛 型 关联 中 出 现 多 个 赋值 表达 式 ， 去 号 分 隔 ， 不 能 使 用 分 号 
// 此 外 ， 需 要 给 这 些 赋 值 表达 式 加 上 圆 括号 ， 以 防止 过 号 人 为 泛 型 关联 的 分 隔 符 
_Generic(x + y, int:(void)(x = 1, y = 2)， 

float:(void)(x = 0.1f, y = 0.2f), default:(void)0); 


printf("x = %d, y = %d\n", x, y); 


泛 型 选择 表达 式 最 第 用 的 是 用 于 做 一 些 标 准 库 。 比 如 ， 像 C 语 言 
标准 库 中 不 少数 学 函数 都 市 有 类 型 前 缀 与 后 级， 通过 汉 型 表达 式 我 们 
可 以 将 这 些 前 缀 与 后 缀 给 应 用 开发 者 给 抽象 挥 ， 不 暴露 出 来 ， 这 样 便 
于 开发 者 更 便捷 地 使 用 这 些 标准 库 API。 下 面 再 举 一 些 例子 来 说 明 这 
种 用 法 。 


代码 清单 14-4 泛 型 选择 表达 式 用 于 标准 库 的 制作 


#include <stdio.h> 
#include <math.h> 
#include <stdlib.h> 


// 这 里 定义 了 一 个 gen_abs 宏 函数 ， 用 于 判定 expr 表 达 式 的 类 型 。 

// 如 果 是 Int ， 则 使 用 abs 库 函数 ， 如 果 是 1ong， 则 使 用 Labs; 

// 如 果 是 float， 则 使 用 fabsf 库 函数 ， 如 果 征 double， 则 使 用 fabs 库 函数 ; 

// 如 果 是 long double， 则 使 用 fabs1 库 函数 ， 默 认 使 用 fabs 

#define gen_abs(expr) _Generic((expr), int:abs, long:labs, float:fabsf, \ 
double:fabs, long double:fabsl, default:fabs) \ 
(expr) 


// 这 里 定义 了 一 个 gen_pow 实 函数 ， 判 定 base + exponent 这 一 表达 式 的 类 型 
#define gen_pow(base, exponent) _Generic((base) + (exponent), \ 
float :powf, 
double:pow, long double:powl, \ 
default:pow) (base, exponent) 


int main(int argc, const char* argv[]) 


// 由 于 一 109 表 达 式 是 Int 类 型， 所 以 这 里 选择 了 abs 另 外 这 里 再 要 提醒 各 位 的 是 ， 
// 一 个 画 数 标志 用 在 表达 式 中 则 默认 表示 为 一 个 指向 画 数 的 指针 类 型 ， 

// 所 以 这 里 整个 泛 型 选择 表达 式 的 结果 为 : abs ( -100) 

int a = gen_abs(-100); 


// 由 于 1000L 表 达 式 是 long 类 型 ， 所 以 这 里 选择 了 labs 


// 由 于 0 ,5f 和 表达 式 是 flLoat 类 柜 ， 所 以 这 里 选择 了 fabsf 
float f = gen_abs(0.5f)， 


printf("value = %fxn"，a+ 1 + f); 


// 这 里 base 的 类 型 为 float，exponent 的 类 型 为 6.0， 两 者 相 加 的 类 型 则 取 double。 
// 因此 ， 这 里 泛 型 选择 的 最 终 表 达 式 为 pow(2.0f，6.0) 

double d = gen_pow(2.0f, 6.0); 

printf("d = %d\n", (int)d); 


我 们 在 使 用 泛 型 表达 式 的 时 候 必 须要 注意 ， 在 泛 型 关联 列表 中 不 
能 出 现 两 个 一 样 的 类 型 ， 也 不 能 找 不 到 任何 与 赋值 表达 式 的 类 型 匹配 
的 泛 型 关联 ， 否 则 会 引发 编译 报错 。 对 于 无 法 找到 所 匹配 类 型 的 情 
况 ， 我 们 应 该 要 加 上 default 泛 型 关联。 男 外 ， 泛 型 天 联 中 类 型 后 面 要 
跟 的 是 一 个 表达 式 ， 而 不 是 一 条 语句 ， 所 以 不 能 出 现 分 号 ， 也 不 能 出 
现 {} 这 种 语句 块 。 


除了 上 述 提 到 的 基本 类 型 外 ， 对 于 我 们 自 定义 的 枚 举 、 结 构 体 、 
联合 体 类 型 以 及 各 种 指针 类 型 也 都 可 以 用 泛 型 表达 式 。 然 而 ， 当 泛 型 
关联 中 的 表达 式 为 赋值 表达 式 时 ， 当 前 主流 的 C 语 言 编译 器 (包括 
GCC 5.4 以 及 Clang 3.8) 对 用 户 自 定义 类 型 的 泛 型 选择 支持 都 不 太 好 ， 
因此 我 们 当前 应 尽量 使 用 C 语 言 中 的 基本 类 型 作为 匹配 类 型 ， 等 以 后 C 
编译 器 完善 了 再 使 用 用 户 自 定 义 类 型 也 不 迟 。 


14.3 ”静态 断言 


ll 


静态 断言 这 一 语法 特性 也 是 C11 标 准 新 引入 的 。 其 意图 是 让 C 语 言 
程序 员 在 编译 时 就 能 提示 出 可 在 编译 时 判定 出 的 错误 ， 并 输出 相应 提 
示 。 静 态 断 言 是 一 条 声明 ， 即 一 条 语句 ， 而 不 是 表达 式 ， 不 过 这 个 语 


法 特性 在 其 他 章节 讲 也 不 是 十 分 合适 ， 所 以 殉 放 到 这 里 介绍 。 


静态 断言 的 语法 形式 为 : 


_Static_assert (常量 表达 式 ,字符 串 字 面 量 ); 


它 表 示 : 如 果苗 量 表达 式 的 值 为 假 ( 即 计算 结果 为 0 或 者 是 一 个 空 
指针 ) ， 那 么 断言 失败 ，C 语 言 实现 将 在 编译 时 产生 一 条 诊断 信息 ， 
诊断 信息 中 包含 后 面子 符 串 字面 量 的 信息 如 末 和 常量 表达 式 的 值 计算 
结果 为 真 ， 那 么 断言 成 功 ， 该 声明 不 起 任何 作用 。 各 位 要 注意 的 是 ， 
这 里 的 津 量 表达 式 必 须 是 一 个 整数 常量 表达 式 。 一 个 整数 兽 量 表达 式 
应 该 具有 整数 类 型 ， 并 且 其 操作 数 应 该 仅 为 整数 第 量 、 枚 举 第 量 、 子 
符 常 量 、sizeof 表 达 式 、_Alignof 表 达 式 ， 以 及 经 过 整数 类 型 投射 操作 
的 浮 点 常量 。 此 外 ， 这 里 的 sizeof 与 _Alignof 的 操作 数 不 应 该 是 可 变 修 
改 类 型 。 而 像 一 个 地 址 前 量 等 表达 式 在 这 里 都 不 能 作为 一 个 整数 币 量 
表达 二 


我 们 在 使 用 静态 断言 


然后 直接 使 用 预定 义 的 宏 


的 时 候 应 该 


添加 上 标准 库 头 文件 <assert.h>， 


宏 函 数 static_assert， 而 不 是 直接 使 用 
_Static_assert。 代 人 码 清单 14-5 展 示 了 静态 断言 的 基本 使 用 方式 与 效果 。 


代码 清单 14-5 ”静态 断言 的 基本 使 用 与 效果 


#include <stdio.h> 
#include <assert.h> 
#include <stdbool.h> 


int main(int argc, const 


char* argv[]) 


// 这 里 常量 表达 式 直接 是 时 


static assert(true, 


"This is true"); 


人 值 ， 所 以 断言 成 功 ， 不 产生 任何 效 


个 假 值 ， 所 以 断言 失败 ， 编 译 器 将 产生 诊断 信息 


// 这 党 表达 式 接 是 
static assert(false, 


int a = 10; 


"This is false"); 


// 这 里 &a 不 是 一 个 整数 常量 表达 式 ， 所 以 多 


// 静态 断言 表达 式 不 是 一 个 整数 常量 表达 式 


static assert(&a, "& 


// 由 于 sizeof(a) 的 大 小 不 为 9， 因 此 断言 成 功 ， 


static assert(sizeof 
enum COLOR { RED, GR 


// 由 于 枚 举 常量 RED 是 0， 


a is not null!"); 


有 译 髓 直接 报错 : 


这 里 不 产生 任何 效果 


(a), "p is null!"),; 


EEN, BLUE }; 


所 以 这 里 断言 失败 ， 


编译 器 将 产生 诊断 信息 


Static_assert(RED， "This is red color"); 


从 代码 清单 14-5 我 们 可 以 看 到 ， 使 用 静态 断言 的 条 件 非常 有 限 。 


我 们 一 般 用 静态 断言 对 当前 编译 环境 


时 对 象 值 的 判定 。 


进行 判定 ， 而 决 不 能 用 于 对 运行 


14.4 Ci 语言 中 的 左 值 


天 于 编程 语言 中 的 “ 左 值 ”， 一 般 通俗 地 来 说 殉 是 可 作为 = 赋值 操作 
符 左 侧 操 作 数 的 表达 式 ， 这 也 意味 着 等 号 左 侧 的 表达 式 要 求 是 一 个 可 
被 修改 的 左 值 。C11 标 准 给 C 语 言 的 左 值 做 了 明确 的 定义 ， 一 个 左 值 表 
达 式 能 隐 式 地 用 来 表示 一 个 对 象 ， 如 果 一 个 左 值 在 计算 时 无 法 用 来 表 
示 一 个 对 象 ， 那 么 行为 是 未 定义 的 。 一 个 可 修改 的 左 值 不 能 是 一 个 数 
组 类 型 ， 不 能 是 一 个 不 完整 类 型 ， 不 能 有 const 限 定 符 修 饰 ， 并 且 如 琳 
该 左 值 是 一 个 结构 体 或 联合 体 类 型 的 话 ， 其 任 一 成 员 也 不 能 有 const 限 
定 符 修饰 。 

当 一 个 左 值 作为 单 目 & 操 作 符 、++ 操 作 符 、-- 操 作 符 的 操作 数 ， 
或 成 员 访 问 操作 符 . 和 赋值 操作 符 = 的 左 操作 数 时 ， 整 个 表达 式 整 不 具 
备 左 值 特 性 了 ， 这 在 C 语 言 中 称 为 左 值 转换 。 


下 面 我 们 就 通过 代码 清单 14-6 来 举 一 些 左 值 表达 式 以 及 非 左 值 表 
达 式 的 例子 。 


代码 清单 14-6 _C 语 言 中 的 左 值 


#include <stdio.h> 
int main(int argc, const char* argv[]) 


int a = 10; 
int *p; 


较 绕 


// 这 里 的 a 是 一 个 左 值 


a += 5; 


// 这 里 的 p 是 一 个 左 什 
p = &a; 


// 当 a 作 为 ++ 操 作 符 的 操作 数 时 ， 它 就 不 再 


是 左 值 了 。 
// 所 以 a++ 表 达 式 不 是 左 值 ， 不 能 作为 = 操 人 人 符 的 左 操作 数 。 这 条 语句 将 会 引发 编译 错误 


// at++ = 0) 


// 让 明 一 个 类 并 为 array05] 的 数组 对 彰 
int array[5] = { 1, 2, 3 }; 


// 数组 类 型 的 对 象 不 外 


eB 作为 左 值 ， 所 以 它 也 不 能 作为 = 操作 符 的 左 操作 数 ， 以 下 语句 会 引发 编译 错误 


array = (int[]){ 4, 5, 6 }; 


// array[1] 表 达 式 是 一 个 左 值 


array[1]++; 


// main 是 int (int, 


main = NULL; // 这 条 语句 将 会 引发 编译 错 i 


int (*pFunc)(int, 


const char > ) 的 画 数 类型 不 能 作为 左 值 


const char**); 


// pFunc 是 指向 画 数 的 指针 类 型 ， 可 以 作为 左 值 


pFunc = &main,; 


// 这 条 语句 将 会 引发 编译 错误 。 作 为 = 操作 符 的 左 操作 数 之 后 ，a 就 不 再 作为 左 值 ， 


// 因此 整个 (a = 10) 
(a = 10) = 100; 


p = array, 


a= 0; 


表达 式 不 是 一 个 左 值 ， 它 不 能 作为 = 操作 符 的 左 操作 数 


// a++ 不 是 一 个 左 值 表 


p[a++] = 30; 


达 式 ， 但 p[a++] 表 达 式 是 一 个 左 值 


// 当 左 值 p[a] 作 为 & 的 操作 数 之 后 就 不 再 是 左 值 ， 因 此 以 下 语句 将 会 引发 编译 错误 


&p[a]l = NULL 


// 而 当 &p[a] 前 面 再 加 * 进 行 解 引用 之 后 ，*&p[a] 表 达 式 又 再 度 成 为 了 左 值 


“&pla] += 10; 


代码 清单 14-6 中 后 面 率 涉 指 针 的 引用 与 解 引 用 部 分 可 能 会 感觉 比 


° 不 过 从 逻辑 上 


很 容易 理解 ， 我 们 取 一 个 对 象 的 地 址 时 得 到 的 十 


该 对 象 的 地 址 值 ， 地 址 值 是 不 能 被 修改 的 ， 因 此 对 对 象 的 引用 目 然 吏 


面 没 有 const 修 饰 ， 自 


古 一 个 常量， 不 能 作为 一 个 左 值 了 。 而 取 一 个 指针 的 内 容 时 ， 由 于 前 


然 束 能 访问 相应 地 址 的 数据 内 容 ， 因 此 解 引 用 表 


达 式 很 目 然 束 能 作为 左 值 。 


另外 ， 代 码 清 单 14-6 也 暗示 了 ， 当 一 个 函数 标志 作为 表达 式 时 ， 
只 有 当 它 扮演 “ 右 值 "时 ， 其 类 型 才 会 被 隐 式 转 为 指 疝 该 画 数 的 指针 类 
型 ， 否 则 它 依 然 保 持 为 画 数 类 型 。 男 外 ， 当 一 个 函数 标志 后 面 跟着 
() 后 缀 操作 符 表 示 函 数 调用 时 ， 该 函数 标志 就 不 再 是 一 个 左 值 了 ， 
它 具 有 指 同 该 画 数 的 指针 类 型 。 对 于 一 个 数组 对 象 ， 通 常 它 均 以 指 癌 
其 元 素 类 型 的 指针 的 形式 作为 表达 式 的 ， 除 非 作 为 单 目 操作 符 &、 
sizeof 、_Alignof 等 操作 符 的 操作 数 时 ， 保 留 其 数组 类 型 。 


“ 右 值 ”在 C11 标 准 中 被 描述 为 “一 个 表达 式 的 值 "， 在 7.4 入 也 有 过 
一 些 介绍 。 不 过 右 值 这 个 概念 在 C 语 言 中 用 得 不 多 ， 因 为 C 语 言 的 类 型 
系统 相对 来 说 还 是 比较 简单 的 ， 而 C++ 则 要 复杂 许多 ， 并 且 也 会 频繁 
用 到 右 值 这 个 概念 〈 比 如 C++11 的 右 值 引用 ， 等 等 ) 。 所 以 各 位 务必 
不 要 混淆 了 C 语 言 跟 C++ 语 言 对 左 值 和 右 值 的 概念 ， 两 者 是 不 太一 样 
的 。C++ 是 将 右 值 定义 为 “作为 一 个 临时 对 象 ?， 显然 范围 比 C 语 言 的 要 
三 很 多 ” 


下 面 举 个 例子 。 在 C 语 言 中 ， 我 们 把 之 前 6.2.3 市 中 提 到 的 匿名 结 
构 体 、6.3 节 中 提 到 的 匿名 联合 体 以 及 7.1 市 中 提 到 的 匿名 数组 统称 为 复 
合 字面 量 (compound literal) 。C 语 言 标准 对 复合 字面 量 的 定义 很 明 
确 : 由 一 个 圆 括 号 包 起 来 的 类 型 名 后 面 跟 着 用 人 花 括 号 包 起 来 的 初始 化 
万 列表 所 构成 的 一 个 后 组 表达 式 。 复 合 字面 量 提供 了 一 个 匿名 对 象 ， 
其 值 由 初始 化 器 列表 提供 。 在 标准 中 ， 这 个 定义 有 一 个 脚 标 ， 注 明 


了 : 复合 字面 量 与 投 冉 表达 式 不 同 。 比 如 ， 投 冉 操 作 仪 仅 指 定 了 对 标 
量 类 型 或 void 类 型 的 转换 ， 并 且 投 射 表 达 式 的 结果 不 是 一 个 左 值 。 这 
句 话 非常 关键 ， 信 息 量 庞大 ! 这 其 实 已 经 意味 着 复合 字面 量 可 以 作为 
左 值 使 用 ， 而 且 实际 上 也 确实 如 此 。 但 在 C++ 中 将 这 种 类 似 的 、 产 生 
匿名 对 象 的 表达 式 称 为 右 值 。 我 们 看 一 下 代码 清单 14-7 所 示 的 C++14 
代码 。 


代码 清单 14-7 C++14 语 言 中 的 临时 对 象 


int main(void) 
struct Test 


int a, b; 
void set(int i) {a=i;b=i+1;} 


// 这 里 的 表达 式 Test{ 10，20 } 是 一 个 右 值 
Test{ 10, 20 }; 

// C++14 中 允许 对 一 个 临时 对 象 ， 即 一 个 右 值 调用 非 const 方 法 来 修改 其 成 员 值 
Test{ 10, 20 }.set(100); 


// 但 是 以 下 3 条 语句 都 是 错误 的 。 
// 在 C++14 标 准 中 不 允许 对 临时 对 象 做 取 地 址 操作 ， 也 不 允许 修改 该 临时 对 象 的 成 员 值 
Test *p = &Test{ 10, 20 } 

Test{ 10, 20 }.a++,; 

Test().a = 0; 


代码 清单 14-7 中 可 以 看 出 ，C++14 中 的 临时 对 象 其 实 是 一 个 右 
值 ， 所 以 不 能 对 它 做 取 地 址 操作 ， 也 不 能 做 目 增 目 减 等 修改 操作 。 但 
征 C++ 因为 有 成 员 方 法 这 个 特性 ， 所 以 可 以 通过 成 员 方法 来 修改 其 成 
员 属 性 的 值 。 因 此 ， 从 这 个 角度 上 来 看 ，C++ 中 所 谓 的 右 值 并 不 是 严 
格 意义 上 不 可 修改 的 。 然 后 ， 我 们 再 看 看 C11 标 准 中 的 对 复合 字面 量 
的 对 每 情况 ， 见 代码 清单 14-8。 


代码 清单 14-8 ” C11 语言 中 的 复合 字面 量 


int main(int argc, const char * argv[]) 


// 对 匿名 数组 做 取 地 址 操作 毫 无 问题 
int (*p)[3] = &(int[]) { 1, 2, 3 }; 


// 对 匿名 数组 做 元 素 修改 也 毫 无 问题 
(int[]) { 1, 2, 3 }[1]++; 


struct Test { int a, b; }; 


// 对 匿名 结构 体 做 成 员 修改 毫 无 问题 
(Struct Test) { 10, 20 }.a+t+; 


// 对 匿名 结构 体 做 取 地 址 操作 也 毫 无 问题 
Struct Test *t = &(struct Test) { 10, 20 }; 


我 们 对 比 代码 清单 14-7 与 代码 清单 14-8 可 以 清晰 地 看 出 ， 对 答 临 
时 匿名 对 象 ，C++ 与 C 语 言 的 方式 是 截然 不 同 的 。 笔 者 之 所 以 在 此 伦 费 
大 量 笔 兴 摘 述 C 语 言 与 C++ 语 言 对 于 右 值 概念 的 区 别 ， 主 要 原因 束 古 笔 
者 在 工作 时 以 及 在 一 些 技术 社区 经 常 发 现 许多 程序 员 会 把 这 两 个 编程 
语言 的 左 值 和 右 值 概念 摘 混 。 这 也 是 由 于 C++ 与 C 语 言 的 兼容 性 比较 强 
所 导致 的 ， 所 以 不 少 程序 员 会 习惯 性 地 把 C++ 的 一 些 概念 氢 到 C 语 言 
上 。 在 大 部 分 情况 下 可 能 没什么 问题 ， 但 这 两 者 在 不 少 细节 上 还 是 有 
一 些 差别 的 。 


当 我 们 知道 了 “ 左 值 ” 这 个 概念 之 后 ， 我 们 束 能 更 清晰 地 了 人 解 到 哪 
些 表 达 式 能 作为 赋值 操作 符 = 的 左 操 作 数 以 及 递增 、 递 减 操作 符 的 操 
作 数 ， 而 哪些 则 不 能 。 


145 蕊 语言 中 有 人 达 式 有 鸭 求 值 顺 友 


C 语 言 标准 对 程序 执行 的 语义 做 了 一 种 抽象 机 行为 的 朱 述 ， 使 得 
对 于 C 语 言 生成 执行 代码 的 优化 可 根据 目 己 的 环境 进行 处 理 。 对 一 个 
表达 式 的 计算 通常 来 说 同时 包括 了 对 值 的 计算 以 及 相应 副作用 的 引 
发 。 对 一 个 左 值 表达 式 的 值 计算 包 含 了 对 它 所 指派 对 象 的 标识 的 判 


i 


化? 


所 谓 次 序 都 是 一 种 相对 关系。 我 们 说 两 个 表达 式 哪 个 执行 在 前 、 
哪个 执行 在 后 ， 都 是 针 对 这 两 个 表达 式 而 言 的 ， 所 以 这 两 个 表达 式 之 
间 就 存在 一 种 次 序 关 系 。C 语 言 中 有 4 种 次 序 关 系 : 执行 在 前 的 次 序 关 
系 (sequenced before) 、 执行 在 后 的 次 序 关 系 (sequenced after) 、 无 
执行 先后 的 次 序 关 系 (unsequenced) 、 不 确定 的 次 序 关系 
(indeterminately sequenced) 。 而 当 我 们 要 判定 两 个 表达 式 的 计算 执 
行 顺序 的 时 候 需 要 一 个 参考 点 ， 以 这 个 位 置 点 来 判定 这 两 个 表达 式 的 
执行 先后 次 序 关 系 ， 那 么 这 个 点 就 称 为 顺序 点 (sequence point) 。 如 
果 表 达 式 A 与 表达 式 B 具 有 前 后 次 序 关 系 ， 并 且 A 的 计算 发 生 在 B 的 之 
前 ， 那 么 在 这 两 个 表达 式 之 间 束 存在 一 个 顺序 点 ， 在 这 个 点 处 ， 与 A 
相关 的 计算 和 副作用 发 生 在 与 B 相 关 的 计算 和 副作用 之 前 。 


1) 执行 在 前 的 次 序 关 系 是 在 同一 线程 中 所 执行 的 两 个 计算 之 间 的 
一 个 非 对 称 、 可 传递 的 二 元 关系 ， 它 在 两 个 计算 之 间 导 出 一 个 偶 序 。 
给 定 两 个 计算 A 和 B， 如 有 果 A 的 次 序 在 B 之 前 ， 那 么 A 的 执行 应 该 在 B 的 
执行 之 前 发 生 。 比 如 : a=b+c; 这 条 语句 中 有 两 个 计算 ， 一 个 是 对 b+c 
的 计算 ， 还 有 一 个 是 对 a 的 赋值 计算 。 这 里 显然 古 先 执行 btc 的 计算 ， 
然后 再 执行 对 a 的 赋值 计算 ， 因 此 表达 式 b+c 与 表达 式 a 的 关系 为 执行 在 
前 的 次 序 关 系 ， 这 里 的 顺序 点 为 = 操作 符 。 这 意味 厦 ， 在 对 a 的 赋值 操 
作 之 前 ， 表 达 式 b+c 的 值 计 算 必 须 先 被 计算 完成 。 


2) 执行 在 后 的 次 序 关 系 则 是 执行 在 前 的 次 序 关 系 的 逆 关 系 。 如 宁 
计算 A 的 次 序 在 B 之 后 ， 那 么 A 的 执行 应 该 在 B 的 执行 之 后 发 生 。 比 
如 : a=b+array[10]; ， 我 们 这 里 仅 观 察 b+array[10] 表 达 式 。 这 里 ， 表 
达 式 b+aray[10] 的 计算 发 生 在 array[10] 之 后 ， 所 以 对 于 整个 表达 式 而 
言 ，b+array[10] 的 执行 次 序 在 其 子 表达 式 array[10] 之 后 ， 并 且 这 里 的 顺 
序 点 为 + 操作 符 。 


3) 无 执行 先后 的 次 序 关 系 是 指 如 果 计 算 A 的 次 序 既 不 在 B 之 前 发 
生 ， 也 不 在 B 之 后 发 生 。 如 果 两 个 表达 式 的 计算 是 无 执行 先后 的 次 序 
关系 ， 那 么 这 两 个 表达 式 的 计算 可 以 交错 执行 ， 甚 至 并 行 执行 。 比 
如 : a= (atb) + (ctd) ; 。 这 里 ， 表 达 式 (a+b) 与 表达 式 (c+d) 
是 无 执行 先后 的 次 序 关 系 。 如 果 处 理 器 支持 指令 级 的 并 行 执行 的 话 ， 
这 两 条 表达 式 可 并 行 执行 。 


4) 不 确定 的 次 序 关 系 是 指 在 表达 式 A 与 表达 式 B 之 间 不 能 确定 A 
发 生 在 B 之 前 还 是 之 后 ， 但 A 一 定 要 么 发 生 在 B 之 前 ， 要 人 么 发 生 在 B 之 
后 ， 两 者 不 可 交错 执行 。 比 如 ， 在 函数 标志 (function designator) 与 
实 参 的 计算 之 后 ， 但 在 实际 调用 之 前 存在 一 个 顺序 点 。 在 函数 标志 表 

达 式 《 即 表示 当前 函数 ) 中 的 每 个 计算 (包括 对 其 他 函数 的 调用 ) 如 
条 没 有 特别 指明 是 在 被 调 函 数 体 的 执行 之 前 还 是 之 后 执行 ， 那 么 相对 
于 被 调 函 数 的 执行 来 说 ， 它 与 这 些 计 算是 不 确定 的 次 序 关 系 。 我 们 下 
面 将 通过 代码 清单 14-9 来 举 一 个 比较 复杂 的 例子 来 说 明 不 确定 的 次 序 
天 条 * 


代码 清单 14-9 不 确定 的 次 序 关系 


#include <stdio.h> 

static int funi(int a, int b) 
puts("funi is called!"),; 
return 1; 

static int fun2(int a, int b) 
puts("fun2 is called!"); 
return 2; 

static int fun3(int a, int b) 
puts("fun3 is called!" 3 
printf("a + b = %d\n", a + b); 
return 3; 

static int fun4(int a, int b) 
puts("fun 4 is called!"); 


return 9; 


int main(int argc, const char* argv[]) 


// 这 里 声明 了 一 个 指向 int(int， int ) 画 数 指针 的 数组 


int (*pFuncList[])(int, int) = { 
&funi, &fun4, &fun2, &fun3 


pFuncList[fun1i(1, 2)](fun2(10, 20), fun3(-2, 10) + fun4(0, 0)); 


代码 清单 14-9 中 ， 表 达 式 pFuncList[fun1 (1，2) ] 就 作为 一 个 函数 
标志 ， 它 指明 了 即将 调用 的 一 个 函数 。 而 这 里 ， 顺 序 点 就 是 在 对 表达 
式 pFuncList[fun1 (1, 2) ] 以 及 fun2 (10, 20) 、fun3 (-2, 10) +fun4 
(0，0) 的 计算 之 后 ， 在 实际 函数 调用 发 生 之 前 那 一 刻 。C 语 言 标准 
明确 指出 ，fun1、fun2、fun3、fun4 可 以 以 任 一 次 序 进行 调用 ， 在 
Apple LLVM 8.0 编 译 絮 实现 中 ， 先 调用 的 是 fun1， 然 后 是 fun2， 表 是 
fun3， 最 后 是 fun4。 为 何 函 数 调用 之 间 的 顺序 点 是 不 确定 的 ， 而 不 是 
无 执行 次 序 的 呢 ? 其实 对 于 经 典 的 处 理 絮 执行 模型 而 言 ， 一 个 线程 中 
处 理 器 同时 只 能 处 理 一 个 分 文 跳 转 ， 所 以 当前 后 同时 有 两 个 分 文 指令 
或 函数 调用 指令 时 ， 处 理 器 必须 一 个 一 个 执行 ， 而 无 法 同时 执行 ， 因 
此 这 里 的 次 序 关 系 束 是 不 确定 的 次 序 和 关系， 并且 此 次 序 关 系 可 根据 编 
译 右 的 优化 需要 等 上 下 文 环境 来 确定 。 


讲 完了 执行 次 序 之 后 ， 我 们 再 来 主 细 讨论 一 下 C 语 言 中 的 顺序 
点 。 下 面 描述 顺序 点 会 存在 的 地 方 。 


1) 在 一 个 函数 调用 中 函数 指派 符 和 实 参 的 计算 与 函数 实际 调用 之 
间 〈 见 代码 清单 14-9) 


2) 以 下 操作 符 的 第 一 个 操作 数 与 第 二 个 操作 数 的 计算 之 间 : 逻辑 
与 \&&) 、 人 逻辑 或 (|) 、 喜 号 〈，) 。 


3) 在 条 件 操 作 符 ? : 的 第 一 个 操作 数 与 第 二 个 或 第 三 个 操作 数 的 
计算 之 间 。 比 如 : expr1? expr2: expr3; 表达 式 exprl 与 表达 式 2 或 表 
达 式 3 的 计算 之 间 存 在 一 个 顺序 点 。 


4) 在 一 条 完整 声明 符 的 末尾 。 


5) 在 对 一 条 完整 表达 式 的 计算 与 下 一 条 要 被 计算 的 完整 表达 式 之 
间 。 所 谓 完整 表达 式 即 为 : 不 作为 一 个 复合 字面 量 一 部 分 的 一 个 初始 
化 器 ， 一 条 表达 式 语 句 中 的 表达 式 ; 一 条 选择 语句 (if 或 switch) 的 控 
制 表 达 式 ， 一 条 while 或 do 语句 的 控制 表达 式 ， 一 条 for 语 句 的 每 条 可 选 
的 表达 式 ;， 一 条 return 语 句 中 的 可 选 表达 式 。 它 不 作为 一 个 声明 符 中 为 
一 个 表达 式 的 某 一 部 分 。 


6) 紧 放 在 一 个 库 函 数 返 回 之 前 。 
7) 与 每 个 格式 化 的 输入 输出 函数 转换 说 明 符 相关 的 行为 之 后 。 
8) 在 对 一 个 比较 函数 的 每 一 次 调用 之 前 与 之 后 ， 以 及 在 对 一 个 比 


较 函 数 的 任 一 次 调用 与 作为 实 参 传递 的 对 象 传 值 之 间 。 


代码 清单 14-10 朱 述 了 顺序 点 的 一 些 例 子 以 及 相应 的 执行 顺序 。 


代码 清单 14-10 ”关于 顺序 点 的 一 些 例子 


#include <stdio.h> 


int main(int argc, const char* argv[]) 


{ 
int a = 10; A J 
// 在 int a = 19; 这 条 声明 符 之 后 有 一 个 顺序 点 
int b = 20; 
// 在 表达 式 ++a > 0 与 表达 式 b-- < 10 之 间 有 一 个 顺序 点 ， i 
// ++a > 0 的 执行 一 定 在 b-- < 16 中 任 一 子 表达 式 的 执行 2 前 执行 完成 。 
// 同时 ， 这 里 if 中 的 完整 表达 式 与 if 下 面 的 printf 范 数 调 用 之 间 存 在 顺序 点 
if(++a > 0 && b-- < 100) 
// 对 于 这 条 打印 画 数 调用 ， 在 第 一 个 a = %d 的 %d 之 后 有 一 个 顺序 点 ， 
// 使 得 在 打印 出 a = 11 之 后 才能 打印 出 b = 19 
printf("a = %d, b = %d\n", a, b); 
// 表达 式 a < b 与 后 面 两 个 表达 式 之 间 有 一 个 顺序 点 ， a 
// 表达 式 a < b 一 定 先 执行 完成 ， 然 后 再 执行 第 二 个 或 第 三 个 表达 式 
a=a<b?a+1 :aa -IT 
// 这 里 ， 表 达 式 ++b + 1 与 ++a - 1 之 间 存在 一 个 顺序 点 ， 
// 在 ++ b + 1 完成 之 前 ，++a - 1 中 的 任 一 子 表达 式 计算 都 不 能 开始 执行 
a= (++b + 1, ++a - 1); 
} 


最 后 要 提醒 各 位 的 是 ， 如 果 在 一 条 语句 中 出 现 对 同一 标量 对 象 的 
多 个 无 执行 次 序 关 系 的 修改 ， 那 么 行为 是 未 定义 的 。 代 码 清 单 14-11 列 
出 了 这 种 情况 。 


代码 清单 14-11 对 同一 个 对 象 的 多 个 无 执行 次 序 的 修改 


#include <stdio.h> 
int main(int argc, const char* argv[]) 
int array[] = { 1, 2, 3, 4 }; 
int *p = array; 
int a = 0; 
// 在 这 条 赋值 对 
// 而 右 操作 数 寻 


p[a++] = ++a; 


达 式 中 ， 作 为 = 人 A ple le A a 
达 式 ++a 也 同时 对 对 象 a 进 行 修改 ， 那 么 这 将 会 引发 未 定义 行为 


Struct Test 


int x, y; 
J}t={0,1}; 


// 这 条 语句 没有 问题 ， 尽 管 这 里 的 ++ 操 作 都 是 针对 同一 个 对 象 ， 但 t 是 一 个 结构 体 ， 


// 不 是 一 个 标量 类 型 ， 同 时 ，++ 分 别 对 t 的 x 成 员 与 y 成 员 进 行 操 作 ， 这 是 两 个 不 同 的 元 素 。 
// 因此 这 条 语句 不 会 发 生 未 定义 行为 


p[++t.x] = ++t.y; 


另外 ， 还 有 一 个 C 语 言 程序 员 讨 论 得 比较 多 的 问题 ， 即 表达 式 
x+++++y; 最 后 产生 一 个 什么 结果 的 问题 。 其实，C 语 言 标准 已 明确 指 
出 : 程序 片段 x+++++y 会 被 解析 为 xt+++++y， 这 违反 了 递增 操作 符 的 
约束 (因为 x++ 已 经 不 是 一 个 左 值 ， 它 不 能 再 次 作为 ++ 操 作 符 的 操作 
数 ) ， 即 便 x+++++y 这 种 解析 可 能 产生 一 个 正确 的 表达 式 。 这 段 文字 
其 实 很 清楚 地 表明 了 x+++++y 最 终 会 被 解析 成 什么 ， 这 也 是 对 词法 解 
析 需 的 一 种 约束 。 而 对 于 x+++++y 表 达 式 来 说 ，x++ 与 ++y 征 两 个 无 次 


序 关 系 的 表达 式 ， 并 且 对 x 和 对 y 的 修改 是 作用 在 两 个 不 同 标量 对 象 上 
的 ， 因 此 本 身 没有 什么 问题 。 


14.6 ”C 语 言 中 的 语句 


以 上 描述 的 都 是 与 表达 式 相 关 的 概念 。 这 里 我 们 将 再 简单 介绍 一 
下 C 语 言 中 的 语句 。C 语 言 中 一 共 含 有 6 种 语句 ， 分 别 为 : 标签 语句 
(labeled statement) 、 复 合 语 句 pe statement) 、 表 达 式 语句 
(expression statement) 、 选 择 语 句 (selection statement) 、 达 代 语 名 
(iteration statement) 、 跳 转 语句 (jump statement) 。 因 为 语句 在 本 
书 前 面 的 各 个 章节 中 都 介绍 得 差不多 了 ， 因 此 我 们 以 代码 清单 14-12 中 
的 内 容 来 对 以 上 6 种 语句 做 个 排 号 入 座 。 


代码 清单 14-12 “C 语 言 中 的 语句 


#include <stdio.h> 


int main(int argc, const char * argv[]) 


// 这 是 一 条 声明 ， 而 不 是 语句 
int a, b; 

// 以 下 两 条 是 表达 式 语句 

a = 10; 


4 这 是 一 条 复合 语句 


// 这 三 条 是 在 一 条 复合 语句 中 的 表达 式 语句 
printf("a = %d, b = %d\n", a, b); 
a++， 


} 

// 这 是 一 条 选择 语句 (从 if 到 

// 其 中 从 { 到 } 是 该 选 提 请 句 中 的 复合 语句 
if (a > 10) 


puts("Greater than ten!"); 


// 这 是 一 条 在 选择 语句 中 的 跳 转 语 句 
goto HELLO; 


} 


// 这 也 是 一 条 选择 语句 (从 if 一 直到 else 后 面 的 分 号 ) 
if (b > 10) puts("Greater than ten!"); 
else puts("Less than ten!"); 


// HELLO: a++; 是 一 条 标签 语句 


HELLO: 
a++， // 这 是 一 条 标签 语句 中 的 表达 式 语句 
b++， // 这 条 表达 式 语句 不 属于 标签 语句 中 的 语句 


// 这 是 一 条 选择 语 名 
Switch (a) 


// case0: puts("zero"); 是 一 条 选择 语句 中 的 标签 语句 

case 0: 
puts("zero");  // 这 是 一 条 标签 语句 中 的 表达 式 语句 
break; // 这 是 一 条 跳 转 语句 ， 不 属于 标签 语句 中 的 语句 
// 整个 case 12: puts("twelve"); 是 一 条 选择 语句 中 的 标签 语句 
// puts("twelve"); 是 一 条 标签 语句 中 的 表达 式 语句 

case 12: puts("twelve"); 


break; // 这 是 一 条 跳 转 语句 ， 不 属于 标签 语句 中 的 语句 


// 从 default 一 直到 } 是 一 条 选择 语句 中 的 标签 语句 
// { break; } RE i 合 语句 


default: { 
break; // 这 是 一 条 复合 语句 中 的 跳 转 语句 
} 

} 


// 这 是 一 条 迭代 语句 ，a- -; ”是 迁 代 语句 中 的 表达 式 语 名 


while (a > 0) a--; 


// 从 do 一 直到 分 号 是 一 条 迭代 语句 ， 


// 其 中 从 一 直到 } 是 该 迭代 语句 中 的 复合 语句 
do 
{ 

ba 


} while (b > 0); 


// 这 是 一 条 迭代 语句 ，int i = 0 是 其 中 的 一 条 声明 ， 
// i < 5 以 及 i++ 则 属 了 表达 式 ， 

// att+, b++， 是 该 迭代 语句 中 的 表达 式 语句 

for (int i= 0; i < 5; i++) a++ b++; 


// 从 for 一 直到 } 是 一 条 从 代 语句 
for (a=0)a< 5; a++) 


// 从 if 一 直到 分 号 是 迭代 语句 中 的 选择 语句 
if (a == 3) 
continue; ”// 这 是 选择 语句 中 的 一 条 跳 转 语句 


b--; // 这 是 迭代 语句 中 的 一 条 表达 式 语句 


} 
. // 这 是 一 条 空 语句 
{} // 这 是 一 条 不 包含 任何 语句 的 复合 语句 ， 注 意 ， 复 合 语句 后 面 无 需 加 分 号 


return 0;  ”// 这 是 一 条 跳 转 语句 


14.7 ”本章 小 结 


本 草 首 先 对 C 语 言 的 表达 式 做 了 系统 的 介绍 ， 同 时 详细 介绍 了 泛 
选择 表达 式 以 及 向量 表达 式 。 然 后 补 完 了 C11 标 准 中 新 引入 的 静态 


型 x 
断言 语句 。 


之 后 ， 我 们 提 到 了 C 语 言 中 关于 左 值 的 概念 ， 最 后 讲述 了 C 语 言 中 
表达 式 的 求 值 顺序 以 及 顺序 点 等 相关 概念 。 


通过 对 本 章 的 学 习 ， 各 位 能 对 C 语 言 具体 实现 中 的 一 些 细节 更 深 
入 地 了 解 ， 同 时 也 能 感受 到 C 语 言 标准 所 体现 出 的 灵活 性 ， 而 又 不 缺 
之 约束 性 。C 语 言 标 准 在 某 种 程度 上 给 了 C 语 言 具体 实现 可 针对 当前 运 
行 的 处 理 器 以 及 操作 系统 环境 做 特定 的 执行 优化 。 


第 15 章 ”函数 调用 约定 与 ABI 


我 们 在 第 1 章 中 提 到 过 ，C 语 言 的 一 大 优点 是 我 们 即便 把 源 代 码 编 
译 好 ， 打 包 成 库 ， 我 们 在 另 一 个 项 目 中 仍然 可 以 去 连接 静态 库 或 动态 
库 中 的 全 局 外 部 对 象 以 及 全 局 外 部 函数 。 这 样 ， 我 们 就 可 以 将 静态 连 
接 库 或 动态 连接 库 作 为 插件 或 中 间 件 交 给 其 他 开发 者 来 使 用 了 。 比如 
像 我 们 所 使 用 的 标准 库 函 数 都 是 以 静态 库 或 动态 库 的 方式 做 默认 连接 
的 。 那 么 这 里 就 会 存在 一 个 问题 ， 我 在 调用 库 中 外 部 全 局 函数 的 时 候 
究竟 是 如 何 调用 成 功 的 呢 ? 毕竟 库 中 的 上 下 文 与 当前 项 目 中 的 上 下 文 
可 能 会 不 太一 样 。 为 了 解决 这 一 问题 ， 很 多 操作 系统 给 出 了 针对 当前 
系统 环境 下 的 函数 调用 约定 (Function Calling Convention) 。 有 了 画 
数 调 用 约定 ， 我 们 就 可 以 在 某 个 操作 系统 上 使 用 多 种 不 同 的 C 语 言 编 
译 侨 了 。 尽 管 很 多 C 语 言 编译 器 上 自 成 一 派 ， 比 如 MSVC 编 译 器 与 GCC 
就 完全 不 同 ， 但 只 要 它们 都 能 遵守 同一 函数 调用 约定 ， 那 么 生成 出 来 
的 目标 文件 也 能 正确 地 相互 连接 。 


NN 


ABI 在 之 前 章节 中 也 有 所 提 及 ， 它 的 英文 全 称 是 Application Binary 
Interface， 即 应 用 二 进 制 接口 。 它 是 在 整个 操作 系统 中 对 二 进 制 接口 
规范 的 详细 描述 ， 不 仅 包含 了 函数 调用 约定 ， 而 且 还 规定 了 数据 类 型 
的 对 齐 规则 、 布 局、 大 小 等 ， 还 规定 了 应 用 程序 如 何 做 系统 调用 ; 另 
外 还 有 目标 文件 、 程 序 库 的 二 进 制 格式 ， 使 得 跨 编译 器 的 连接 成 为 可 


能 ， 同 时 操作 系统 的 加 载 右 也 能 成 功 地 加 载 由 不 同 连接 右 最 终 所 构成 
交 同 执 休 文件 J 远 们 NT 


由 于 ABI 详 细 规 则 与 各 个 操作 系统 紧密 相关 ， 并 且 规 范本 喘 也 不 
征 太 商 单 ， 因 此 我 们 下 面 将 主要 简单 介绍 Windows 操 作 系 统 以 及 
Unix/Linux 操 作 系统 下 的 函数 调用 约定 。 至 于 ABI 的 规范 文档 ， 各 位 可 
以 在 网 上 搜索 到 相关 资料 ， 像 大 部 分 Unix/Linux 系 统 在 64 位 模式 的 x86 
处 理 器 中 所 用 的 ABI 遵 循 的 是 System-V 规 范 ， 各 位 能 够 下 载 到 。 


15.1 Windows 操 作 系 统 环 境 下 x86 处 理 需 的 函数 
调用 约定 


Windows 操 作 系 统 中 一 般 x86 处 理 器 用 得 比较 多 ， 因 此 我 们 这 里 也 
针对 x86 处 理 器 做 详细 描述 。 从 AMD 推 出 了 64 位 处 理 器 开始 起 ，x86 处 
理 器 也 能 支持 64 位 模式 了 。 由 于 32 位 模式 与 64 位 执行 模式 在 寄存 器 使 
用 等 方面 会 有 所 不 同 ， 所 以 操作 系统 为 了 能 更 大 效率 地 文 持 64 位 模式 
程序 的 执行 ， 其 函数 调用 约定 也 会 与 32 位 模式 下 的 有 所 不 同 。 下 面 将 
分 别 介绍 32 位 执行 模式 与 64 位 执行 模式 下 的 Windows 操 作 系统 中 的 函数 
调用 约定 。 我 们 一 般 对 Windows 下 MSVC 或 现在 新 引入 的 VS-Clang 编 译 
妖 所 使 用 的 ABI 简 称 为 MS-ABI。 以 下 两 节 中 的 代码 既 可 以 用 MSVC 编 
译 器 构建 ， 也 可 以 用 VS-Clang 编 译 器 构建 ， 两 者 都 默认 采用 MS-ABI 的 
函数 调用 约定 ， 并 且 相 互 兼容 。 


15.1.1 Windows 操 作 系 统 下 32 位 x86 执 行 模式 的 函 
数 调用 约定 


Windows 系 统 中 ，x86 在 32 位 执行 模式 下 的 函数 调用 约定 有 3 种 : C 
函数 调用 约定 ， 标 准 调用 约定 ， 快 速 调用 约定 。 在 所 有 这 3 种 调用 约定 


下 ， 所 有 参数 的 位 宽 都 会 被 扩展 到 32 位 。 比 如 ， 我 们 要 传 一 个 short 类 
型 的 对 象 ， 那 么 在 实际 压 栈 的 时 候 ， 就 会 对 它 进 行 带 符 号 扩展 到 32 
位 ， 因 此 在 函数 实现 中 ， 该 形 参 尽 管 在 类 型 上 仍然 是 short 类 型 ， 但 获 
取 数 据 的 时 候 其 实 可 以 用 int 类 型 来 获 了 到， 当然 我 们 不 建议 这 么 做 。 而 
对 于 返回 值 ， 如 果 要 返回 的 对 象 少 于 4 个 字 方 ， 那 么 它 会 被 扩展 到 4 字 
节 ， 然 后 放 入 EAX 寄 存 右 中 进行 返回 。 如 果 是 一 个 64 位 数据 或 一 个 8 字 
节 的 结构 体 对 象 ， 那 么 实现 会 将 该 8 字 市 对 象 以 EDX: EAX 寄存 器 对 进 
行 存放 。 其 中 ，EDX 寄 存 器 存放 高 4 字 节 ，EAX 存 放 低 4 字 节 。 如 果 要 
返回 的 对 象 大 于 8 字 节 ， 那 么 就 会 将 该 数据 的 起 始 地 址 放 入 EAX 寄 存 器 
中 ， 然 后 在 函数 返回 之 后 通过 EAX 作为 基地 址 将 该 结构 体 对 象 完整 地 
拷贝 出 来 。 在 函数 实现 中 ， 如 果 我 们 需要 使 用 EBX、ESI、EDI 以 及 
EBP 寄存 器 的 话 ， 那 么 需要 先 将 它们 压 栈 保护 ， 等 函数 返回 之 前 则 推出 
堆栈 恢复 之 前 的 值 。 


在 默认 情况 下 ， 如 果 我 们 不 指明 ， 在 C 语 言 中 用 的 就 是 C 函 数 调用 
约定 了 。 我 们 下 面 来 分 别 介绍 这 三 种 调用 约定 。 


C 芳 数 调 用 约定 参照 了 C 语 言 国 数 具 有 不 定 参 数 个 数 的 钞 数 声明 特 
性 ， 所 以 该 调用 约定 古 将 传递 给 函数 的 参数 全 部 压 入 栈 中 ， 并 且 以 从 
右 到 左 的 顺序 依次 将 参数 压 入 栈 中 ， 也 区 是 说 最 后 一 个 参数 移 压 入 栈 
中 ， 第 一 个 参数 最 后 被 讨 入 栈 中 。 在 MSVC 编 译 吉 中 ， 默 认 使 用 C 函 数 
调用 ， 如 果 我 们 要 显 式 地 指明 遵循 C 函 数 调用 约定 的 函数 时 ， 我 们 可 以 


对 该 函数 用 _cdecl 调 用 约定 限定 符 进 行 修 所 ， 此 关键 字 是 MSVC 编 译 
器 对 标准 C 语 言 的 扩展 ， 不 属于 标准 C 语 言 的 范畴 。 采 用 C 函 数 调 用 约 
定时 ， 函 数 调 用 者 负责 将 压 入 堆栈 的 实 参 清除 挥 ， 即 把 栈 指针 恢复 到 
传 参 之 前 的 位 置 。 


当 需 要 指定 一 个 函数 做 标准 调用 约定 时 ， 我 们 在 声明 函数 的 时 候 
使 用 _stdcall 调 用 约定 限定 符 对 该 画 效 标识 符 进 行 修 饥 。 标 准 函 数 调用 
约定 的 参数 传递 与 C 调 用 约定 类 似 ， 在 参数 传递 上 也 走 将 参数 全 都 压 入 
栈 中 ， 不 过 有 所 区 别 的 是 ， 标 准 调用 约定 是 由 函数 实现 自己 清理 传 入 
函数 的 形 参 所 占 的 栈 空间 。 由 于 x86 中 的 RET 画 数 返 回 指令 可 直接 带 操 
作 数 ， 指 示 将 栈 指针 往 上 加 多 少 字 世 ， 使 得 栈 指 针 在 函数 返回 的 同时 
就 能 立即 恢复 到 传 参 之 前 的 位 置 ， 这 也 会 节省 一 部 分 运行 时 开销 。 


当 我 们 需要 指定 一 个 函数 做 快速 调用 约定 时 ， 我 们 在 声明 函数 的 
时 候 使 用 _ fastcall 调 用 约定 限定 符 。 快 速 调用 约定 是 先 竹 试 将 前 两 个 
参数 依次 放 入 ECX 寄 存 器 与 EDX 寄 存 器 《如 果 前 两 个 参数 的 字 世 长 度 
小 于 等 于 4) ， 然 后 将 其 余 参 数 仍然 按照 从 右 到 左 的 次 序 压 入 堆栈 。 快 
速 调用 与 _ stdcall 调 用 约定 一 样 ， 当 函数 返回 之 前 ， 画 数 实现 必须 目 己 
将 之 前 传 入 参数 所 占用 的 栈 空间 做 清除 操作 ， 而 不 是 给 函数 调用 者 去 
做 。 


下 面 我 们 将 为 大 家 介绍 如 何 通过 Visual Studio 2017 Community 来 实 
验 函 数 调用 约定 。 首 先 ， 我 们 根据 第 3 章 提 到 的 内 容 ， 创 建 一 个 win32 


控制 台 的 空 项 目 ， 项 目 名 为 demo。 人 然后 在 该 项 目 工程 中 新 建 main.c 和 
func.asm 两 个 源 文件 。 新 建 func.asm 时 ， 我 们 也 是 选择 “C++ 源 文件 ”， 
然后 对 源 文件 名 命名 为 func.asm 即 可 。 下 面 我 们 要 对 项 目 本 号 进行 设 
置 ， 使 得 它 能 文 持 汇编 语言 的 编译 和 连接 。 我 们 鼠标 右键 点 击 cdemo 项 
目 名 ， 然 后 在 下 拉 栏 中 找到 “生成 依赖 项 *， 然 后 点 击 “ 生 成 目 定 义 ?>， 如 
图 15-1 所 示 。 


| Tr 


cdemo 


查看 (W) 


仅 用 于 项 目 (J) 
限定 为 此 范围 (S$) 
] 新 建 解决 方案 资源 管理 露 视图 (N) 
生成 依赖 项 (B) 
添加 (D) 
B。 类 向 导 四 .. Ctrl+Shift+X 


图 15-1 设置 编译 汇编 涯 文 件 第 一 步 


然后 我 们 会 看 到 一 个 设置 “生成 自 定 义 项 文件 ”的 对 话 框 ， 我 们 勾 
选 上 “masm” 即 可 ， 如 图 15-2 所 示 。 


Visual C++ 生成 自 定义 文件 


可 用 的 生成 自 定义 项 文件 (A): 

名 称 路 径 

DD ImageContentTask(.targets, .... $(VCTargetsPath)\BuildCustomizations\ImageContentTask.ta 
DD lc(.targets, .props) $(VCTargetsPath)\BuildCustomizations\|c.targets 


MI masm(.targets, .props) $(VCTargetsPath)\BuildCustomizations\masm.targets 
| | MeshContentTask(.targets, .... $(VCTargetsPath)\BuildCustomizations\MeshContentTask.tard 


DD ShaderGraphContentTask(.ta... $(VCTargetsPath)\BuildCustomizations\ShaderGraphContent 


图 15-2 设置 编译 汇编 涯 文件 第 二 步 
下 面 我 们 先 看 看 main.c 源 文件 中 的 内 容 ， 见 代码 清单 15-1。 


代码 清单 15-1 MSVC 在 x86 处 理 器 32 位 环境 下 的 函数 调用 约定 C 源 
文件 


#include <stdio.h> 
#include <stdint.h> 
#include <stdbool.h> 


// 计算 (a - b) 
extern int _ cdecl CFunc(int a, int b); 


extern uint64 t CFunc2(void); 
struct Test 
int a; 
int b; 
int c; 
int d; 
}; 
extern struct Test CFunc3(void); 


// 计算 (a - b) - (c - d) 
extern int __fastcall FastFunc(int a, int b, int c, int d); 


int main(void) 


int Value = CFunc(5, 2); 
printf("The C value is: %d\n", value); 


uint64_t llValue = CFunc2( ); 
printf("The long value is: QOx%16llx\n", llValue); 


value = FastFunc(6, 2, 3, 1 
printf("The fast value is: fad\n" , Vvalue); 


struct Test test = CFunc3(); 
printf("a = %d, b = %d, c = %d, d = %d\n", 
test.a, test.b, test.c, test.d); 


代码 清单 15-1 中 我 们 声明 了 4 个 范 数 ， 分 别 是 CFuncl、CFunc2、 
CFunc3 和 FastFunc。CFunc1l 用 于 观察 传递 两 个 32 位 整 型 参数 时 ， 采 用 C 
调用 约定 的 参数 传递 情况 ，CFunc2 则 是 用 于 观察 返回 值 为 8 字 节 时 函数 
所 返回 的 情况 ;CEFunc3 则 观察 当 返 回 值 是 一 个 较 大 结构 体 对 象 时 ， 画 
数 返 回 情 况 ; FastFunc 则 是 用 于 观察 调用 一 个 快速 调用 约定 的 函数 时 ， 
给 它 传 递 4 个 参数 的 情况 。 为 了 便于 观察 ，CFunc1 的 汇编 实现 用 的 是 返 
回 第 1 个 参数 减 去 第 2 个 参数 的 结果 ; FastFunc 的 实现 是 先 用 第 1 个 参数 
减 去 第 2 个 参数 结果 ， 再 减 去 第 3 个 参数 与 第 4 个 参数 的 结果 ， 然 后 将 最 
终 值 返回 出 来 。 


涝 


下 面 我 们 看 一 下 汇编 源 文件 。 


代码 清单 15-2 MSVC 在 x86 人 处 理 器 32 位 环境 下 的 函数 调用 约定 汇 
编 源 文件 


; 汇编 源 文件 func .asm 


.model] flat 
.Code 


_CFunc proc public 


mov eax, [esp + 4] ; EAX 存放 第 一 个 参数 
mov ecx，[esp + 8] ; ECX 存 放 第 二 个 参数 


Sub eax, ecx 


ret 


_CFunc endp 


_CFunc2 proc public 
mov edx, 12345678H ; 存放 高 4 字 节 
mov eax，9gabcdefH 存放 低 4 字 节 
ret 
_CFunc2 endp 
_CFunc3 proc public 
push 40 ; 给 成 员 d 赋 值 
push 30 ; 给 成 员 c 赋 值 
push 20 ; 给 成 员 b 赋 值 
push 10 ; 给 成 员 a 赋 值 
mov eax, esp ; 将 当前 栈 指针 赋 给 EAX 作为 所 返回 结构 体 对 象 的 起 始 地 址 
add esp, 16 ; 将 栈 指针 恢复 到 返回 地 址 处 
ret 
_CFunc3 endp 


@FastFunc@16 proc public 


获取 第 一 个 参数 值 ， 传 给 EAX 


moVv eax, eCX 


sub eax, edx 5 ， 将 第 一 个 参数 值 与 第 二 个 参数 全 居 了 存 到 EAX 
mov ecx, [esp + 4] ; 读 取 第 二 个 参数 ， 存放 到 EC 

mov edx, [esp + 8] 读 取 第 四 个 参数 ， 存 放 3 |EDX 

sub ecx, edx ， 将 第 三 个 参数 碱 拓 第 四 个 参数 的 什 存 放 回 ECX 

sub eax, ecx ; 将 第 一 个 差 值 与 第 二 个 差 值 再 相 减 ， 存 放 到 EAX 返 回 


; 这 里 用 ret 8 是 将 压 栈 的 两 个 参数 在 函数 返回 后 直接 推出 栈 
; 相当 于 :” ret; add 人 8; 
ret 8 


Q@FastFunc@16 endp 


end 


通过 代码 清单 15-2， 我 们 看 到 ，CFunc2 最 终 返 回 
0x12345678_90abcdef。 而 CFunc3 最 终 所 返回 的 结构 体 的 成 员 依次 是 
10、20、30、40。 我 们 注意 到 ，FastFunc 子 过 程 最 后 用 ret 8 表示 函数 返 
回 后 ，ESP 自 动 加 8， 以 回收 压 入 栈 中 作为 形 参 的 栈 空间 。 


下 面 通 过 图 15-3 来 描述 CFunc1 的 参数 传递 时 栈 空间 的 数据 存放 情 
Wa 


JJ 从 图 15-3a 中 可 以 看 到 ， 一 开始 在 调用 CFunc 之 前 假定 此 时 ESP 栈 
指针 指向 0x010C 的 位 置 ， 由 于 当前 栈 指针 所 指 的 栈 空间 地 址 属于 函数 
调用 者 的 上 下 文 ， 所 以 其 数据 不 用 动 ， 用 X 表 示 。 其 余数 据 用 ? 表示 未 
知 数 据 。 


@) 在 调用 CFuncl 之 前 ， 先 传递 参数 ， 并 且 是 以 从 右 到 左 的 顺序 传 
递 ， 先 传 右边 参数 ， 即 第 二 个 参数 ， 我 们 发 现 此 时 ESP 到 了 0x108 的 位 
置 ， 并 且 0x108 到 0x10B 存 放 的 是 32 位 带 符号 整数 2 ( 见 图 15-3b) 。 


(3) 如 图 15-3c 所 示 ， 传 入 左边 参数 ， 即 第 一 个 参数 ， 此 时 栈 指针 
ESP 再 癌 下 减 4， 到 了 0x0104 的 位 置 ， 这 里 0x0104 到 0x0107 存 放 的 就 是 


第 一 个 参数 的 数据 ， 即 32 位 带 符 号 整数 5。 


由 做 CFunc1 画 数 的 调用 〈 见 图 15-3d) ， 执 行 CALL 指 令 之 后 ， 会 
自动 将 当前 CALL 指 令 的 下 一 条 指令 的 地 址 压 入 栈 中 ， 此 时 ESP 也 移动 
到 了 0x100 的 位 置 。 因 此 我 们 访问 [ESP+4] 就 是 访问 第 一 个 参数 的 数 
据 ， 而 访问 [ESP+8] 就 是 访问 第 二 个 参数 的 数据 。 


CFunc1 函 数 调 用 前 栈 指针 的 位 置 


0x010C 
0x0108 
0x0104 


0x0100 


Ox010C 
Ox0108 
0x0104 


0x0100 


先 传 入 第 二 个 参数 


0x010C 
0x0108 


0x0104 


0x0100 
b) 


0x0104 


0x0100 ESP 


图 15-3 ”CFuncl 调 用 前 后 的 参数 传递 及 栈 指 针 的 变化 


图 15-4 描 述 了 调用 CFunc3 之 后 ， 结 构 体 成 员 与 栈 的 对 应 关系 以 及 


栈 指 针 的 变化 ， 最 后 函数 返回 前 后 


需要 做 的 工作 。 


CFunc3 函 数 调 用 之 前 调用 CFunc3 函 数 给 局 部 结构 体 对 象 初始 化 ”函数 返回 之 前 恢复 栈 指针 


二 X X 
Ox0114 ESP 0x0114 Ox0114 Ox0114 

加 返回 地 址 返 返回 地 址 
0x0110 0x0110 | 返回 地 址 | ESsp ”0x0110| 返回 地 址 0x0110 | 返回 地 址 | Bsp 
0x010C ? 0x010C ? 0x010C| 40 oOx010C| 40 
0x0108 ? 0x0108 2? 0x0108 30 0x0108| 30 
0x0104 ? Ox0104 ? 0x0104| 20 0x0104| 20 
0x0100 ? 0x0100 2? 0x0100 10 ESP ”0x0100 10 EAX 

a b) ey d) 


图 15-4 ”CFunc3 函 数 调 用 前 后 栈 数据 以 及 栈 指针 变化 


只 由 于 我 们 在 调用 CFunc3 的 时 候 ， 它 没有 参数 ， 所 以 不 需要 先 做 
压 栈 操作 。 我 们 这 里 也 是 用 ? 表示 此 时 栈 空间 中 的 数据 见 图 15-4a。 


G@) 调 用 CFunc3 之 后 ，x86 处 理 器 会 先 将 当前 CALL 指 令 的 下 一 条 指 
令 的 地 址 压 入 栈 中 ， 然 后 ESP 到 0x0110 的 位 置 〈( 见 图 15-4b) 。 


(3) 在 CFunc3 内 ， 对 要 返回 的 结构 体 对 象 进行 初始 化 ， 其 成 员 a 到 d 
依次 被 赋值 为 10、20、30 和 40， 此 时 ESP 会 在 0x0100 的 位 置 ( 见 图 15- 
4c) 。 


9 在 函数 返回 之 前 ， 我 们 先 用 EAX 寄 存 器 记录 当前 ESP 的 位 置 ， 这 
样 EAX 束 会 作为 指 癌 该 结构 体 对 象 的 指 计 被 运 回 出 去 了 。 


然后 我 们 将 ESP 恢 复 到 之 前 保存 返回 地 址 的 那个 位 置 ， 执 行 返回 指 
令 ( 见 图 15-4d) 。 


避 在 函数 调用 端 ， 编 译 器 实现 将 会 先 获取 返回 出 来 的 EAX 的 值 ， 
然后 将 EAX 所 指向 的 结构 体 对 象 拷贝 到 其 栈 上 下 文中 。 


这 个 过 程 是 立即 实现 的 ， 因 为 我 们 在 图 15-4 中 也 看 到 了 ， 返 回 的 结 
构 体 对 象 的 实体 其 实 已 经 被 回收 了 ， 所 以 在 做 其 他 函数 调用 或 需要 使 
用 栈 空 间 的 动作 之 前 ， 必 须 将 此 对 象 的 值 给 拷贝 出 来 。 当 然 ， 如 有 果 我 
们 仅仅 调用 CFunc3 函 数 ， 而 不 是 通过 = 赋值 操作 和 从 将 其 返回 值 赋值 给 调 
用 者 的 结构 体 对 象 ， 那 么 CFunc3 中 的 临时 结构 体 对 象 也 不 需要 被 找 贝 
出 来 。 


15.1.2 ”Windows 操 作 系 统 下 64 位 x86 执 行 模式 的 函 
数 调用 约定 


x86 处 理 紫 在 64 位 模式 下 ， 通 用 寄存 如 的 位 贺 不 仅 增加 到 了 64 位 ， 
而 且 可 用 的 通用 寄存 右 的 数量 也 增长 了 1 倍 。 表 15-1 中 列 出 了 x86 人 处 理 句 
在 32 位 与 64 位 模式 下 所 有 可 作为 通用 目的 计算 使 用 的 寄存 髓 。 


表 15-1 x86 处 理 器 在 32 位 与 64 位 执行 模式 下 所 有 可 作为 通用 目的 寄存 
铝 列 表 


寄存 器 类 型 32 位 执行 模式 64 位 执行 模式 
8 位 寄存 器 人 AL.. BL CL BDL, DIL SIL, BRL, 

HA 他 1 \ \ S s SS S \ 

| SPL、R8L - R15L 

ee 六 、 有 诡 、 才 DI、 家 BPY、 证 ， 
16 位 寄存 器 AX、BX、CX、DX、DI、SI、BP、SP 

R8W - RI5W 

EAX EBX, BCD, EDX, BEDI, BSI,| EAX, EDX BED EDX HDI Bl. 

32 位 寄存 器 
EBP 、ESP EBP、ESP、R8D - R15D 


RAX. RBX. RCX. RDX. RDI. RSI. 
64 位 寄存 器 不 可 
位 寄存 顺 用 RBP、RSP 、R8 - R15 


表 15-1 中 ，SP、ESP 以 及 RSP 是 作为 栈 指针 寄存 器 使 用 ， 一 般 只 能 
用 它 做 栈 指针 操作 ， 而 不 能 做 其 他 通用 目的 用 途 。 


在 Windows 系 统 的 画 数 调用 约定 中 ，x86 处 理 右 在 64 位 模式 下 ， 琅 
数 实 现 需 要 自己 保存 RBX、RDI、RSI、RBP、R12、R13、R14 与 R15 
这 些 通 用 目的 寄存 器 ， 如 果 在 当前 函数 中 用 了 这 些 寄 存 器 的 话 。 而 其 
他 通用 目的 寄存 器 都 由 函数 调用 者 自己 维护 。 另 外 ， 所 有 SIMD 寄 存 器 
(MMX 、XMM、YMM 与 ZMM 寄 存 器 ) 也 都 由 函数 调用 者 自己 维 
护 ， 函 数 实现 直接 使 用 即 可 。 


对 于 参数 传递 ，64 位 模式 下 就 没 32 位 模式 那么 复杂 了 ， 它 只 有 一 
种 调用 方式 。 由 于 有 充足 的 寄存 占用 来 存放 参数 ， 所 以 MS-ABI 规 定 ， 
X86 处 理 右 在 64 位 模式 下 ， 对 于 前 4 个 整数 参数 ， 依 次 放 入 RCX、 
RDX、R8 与 R9 寄 存 句 ;之 后 的 参数 都 是 以 从 右 到 左 的 次 序 依 次 压 入 栈 
中 。 这 里 需要 注意 的 是 ， 即 便 前 面 4 个 参数 都 没有 实际 压 入 栈 空 间 ， 但 
函数 调用 者 一 般 会 为 它们 保留 对 应 的 在 调用 函数 中 的 栈 位 置 ， 这 样 看 
上 去 束 仿 佛 这 些 寄存 古 也 被 讨 入 了 调用 范 数 的 栈 空 间 一 样 。 因 此 我 们 


在 函数 实现 中 要 访问 第 5 个 参数 ， 其 实 也 需要 将 RSP 栈 指针 加 40 进 行 访 
问 ， 而 第 6 个 参数 则 需要 将 RSP 加 48 进 行 访 问 。 图 15-5 展 示 了 将 在 代码 
清单 15-3 中 所 声明 的 函数 MyFunc2 (inta, intb, intc, intd, int16_t 
e，int16 tf) 的 函数 调用 前 后 栈 指针 的 变化 。 


调用 MyFunc2 之 前 先 将 栈 指 针 移 到 仿佛 传递 了 所 有 6 个 参数 之 后 的 位 置 


0x0138 RSP 0x0138 
0x0130 0x0130 

0x0128 0x0128 

0x0120 0x0120 

0x0118 0x0118 

0x0110 0x0110 

0x0108 0x0108 RSP 
0x0100 0x0100 

b ) 
再 传 第 5、 第 6 个 参数 最 后 调用 MyFunc2 

0x0138 0x0138 

0x0130 第 6 个 参数 pe 0 | 第 6 个 参数 
0x0128 第 5 个 参数 0x0128 第 5 个 参数 
0x0120 0x0120 

0x0118 0x0118 

0x0110 0x0110 

0x0108 RSP 0x0108 

0x0100 0x0100 RSP 


图 15-5 ”Windows 系 统 64 位 模式 下 调用 MyFunc2 前 后 的 栈 空间 变化 


从 图 15-5 我 们 能 清楚 看 到 ， 当 我 们 调用 MyFunc2 芳 数 之 前 ， 函 数 调 
用 者 会 做 不 少 工 作 。 先 把 栈 指针 往 下 移 到 正好 能 放 入 6 个 实 参 的 位 置 ， 
随后 将 第 5、 第 6 个 实 参 放 入 到 MyFunc2 栈 空间 相应 的 栈 空 间 位 置 作为 
其 形 参 ， 最 后 调用 MyFunc2 琴 数 。 


下 面 ， 我 们 在 展示 代码 之 前 先 教 大 家 如 何在 Visual Studio 2017 
Community 下 生成 64 位 程序 的 步 又 。 与 之 前 一 样 创建 一 个 Win32 控 制 台 
应 用 程序 的 空 项 目 。 然 后 右 击 源 文 件 文件 来， 选择 新 建 项 ， 新 建 main.c 
与 func.asm 两 个 源 文件 并 添加 到 项 目 工程 中 。 然 后 ， 与 图 15-1 和 图 15-2 
一 样 ， 添 加 MASM 的 编译 选项 。 由 于 asm 文 件 因为 版 本 不 同 ， 可 能 默认 
不 作为 汇编 源 文件 参与 编译 ， 所 以 需要 为 它 添加 编译 项 类 型 。 我 们 先 
右键 点 击 func.asm， 如 图 15-6 所 示 : 


然后 选择 “属性 ”， 进 入 func.asm 文 件 的 设置 ， 如 图 15-7 所 示 。 


加 func.asm 
G 打开 (O) 
打开 方式 (N)… 
他 查看 类 图 (V) 
编译 (M) Ctrl+F7 


限定 为 此 范围 (9) 


新 建 解决 方案 资源 管理 器 视图 (N) 

从 项 目 中 排除 () 

莫 切 (T) Ctrl+X 

复制 (Y) Ctrl+C 

移 除 (V) Del 

重 命名 (M) 

ER ArEnter 


图 15-6 “右键 点 击 func.asm 


图 15-7 设置 func.asm 的 Item Type 


一 开始 ，func.asm 的 “项 类 型 > 是 “不 参与 生成 ”>， 现 在 我 们 点 击 右边 
的 三 角 箭 头 ， 然 后 选中 *Microsoft Macro Assembler”， 这 样 此 文件 能 


MASM 汇 编 器 进行 编译 了 。 


;为了 使 配置 司 时 适用 于 调 江 模 式 与 发 布 模式 ， 我 们 
在 左上 角 选 择 “ 所 有 配置 "， 同 时 注意 当前 的 平台 是 x64， 因 为 我 们 要 测 
试 的 程序 是 64 位 应 用 程序 。 如 果 我 们 之 前 没有 设置 当前 活动 平台 为 
x64， 那 么 可 以 根据 图 15-8 进 行 设置 。 在 工具 栏 中 “Debug” 那 个 选择 控 
件 右边 有 一 个 原本 默认 显示 “x86” 的 选择 框 ， 现 在 将 它 选 择 为 “x64”。 这 
个 选择 框 就 是 用 于 指定 解决 方案 平台 的 。 这 样 我 们 编译 生成 的 应 用 就 
是 64 位 应 用 了 。 


Team Tools Test Window 


- Pb Local 


图 15-8 ”将 解决 方案 平台 设置 为 64 位 模式 ， 以 生成 64 位 应 用 


这 些 设置 完成 之 后 ， 我 们 整 来 看 代码 清单 15-3。 由 于 64 位 模式 下 孙 
数 调用 约定 束 一 种 ， 所 以 这 里 束 列 出 了 两 个 芳 数 的 例子 ， 分 别 为 


MyFunc1 与 MyFunc2。 


代码 清单 15-3 “Windows 系 统 x86 处 理 64 位 模式 下 的 函数 调用 约定 C 
源 文 件 


// main.c 源 文件 
#include <stdio.h> 
#include <stdint.h> 


// 执行 (a - b) / (c - d) 操 作 
extern int MyFunci(int64 t a, int8_t b, int32_t c, int16 _t d); 


// 执行 (a + b+ c+d)/ (e -ff) 操 作 
extern int MyFunc2(int a, int b, int c, int d, int16 t e, int16_t f); 


int main(void) 


int result = MyFunc1(12, 4, 3, -1); 
printf("MyFunc1 division result: %d\n", result); 


result = MyFunc2(10, 20, 30, 40, 70, 60); 
printf("MyFunc2 division result: %d\n", result); 


puts("\nprogram completed!"); 


getchar(); 


代码 清单 15-3 所 列 出 的 代码 很 简单 ， 这 里 不 多 做 介绍 。 不 过 这 里 要 
提醒 各 位 的 是 ， 请 留意 一 下 这 两 个 函数 的 每 个 参数 类 型 ， 后 面 在 汇编 
源 文 件 中 会 做 相关 处 理 。Windows 系 统 x86 处 理 64 位 模式 下 的 函数 调用 
约定 汇编 源 文件 如 代码 清单 15-4 所 示 。 该 源 文件 列 出 了 MyFunc1l 与 
MyFunc2 的 具体 实现 。 


代码 清单 15-4 Windows 系 统 x86 处 理 64 位 模式 下 的 函数 调用 约定 
汇编 源 文 件 


; func.asm 汇 编 源 文件 
.Code 


MyFunc1 proc public 


; 由 于 第 二 个 参数 是 8 位 整数 ， 第 四 个 参数 是 16 位 整数 ， 因 此 需要 将 它们 做 带 符号 扩展 ， 
; 否则 ， 高 位 可 能 存在 其 他 非 零 数据 ， 会 影响 后 续 计算 


moVvSx rdx, dl 
moOVSX r9, r9w 
sub rcx, rdx 


; 将 第 一 个 参数 与 第 二 个 参数 相 减 ， 结 果 存 放 到 RCX 寄 存 器 
mov rax, rex 
xor rdx, rdx ; 将 RDX 寄 存 器 清 零 ， 它 将 作为 被 除数 的 高 64 位 


sub r8, rg9 ; 将 第 三 个 参数 与 第 四 个 参数 相 减 ， 结 果 存 放 到 R8 寄 存 器 作为 除数 
idiv r8 
ret 
MyFunc1 endp 
MyFunc2 proc public 
add recx, rdx ; 将 第 一 个 参数 与 第 二 个 参数 相 加 ， 结 果 存 入 RCX 寄 存 器 
add r8, r9 ; 将 第 三 个 参数 与 第 四 个 参数 相 加 ， 结 果 存 入 RDX 寄 存 器 
add rcx, r8 ;将 两 个 求 和 结果 再 次 求 和 ， 结 果 存 入 RCX 寄 存 器 
mov rax, rex ; 将 结果 移入 RAX 寄 存 器 ， 作 为 被 除数 的 低位 部 分 
xor rdx, rdx ; 将 RDX 寄 存 器 清 零 ， 它 将 作为 被 除数 的 高 位 部 分 
mov rcx, [rsp + 40] ; 获取 第 5 个 参数 
mov r8，[rsp + 48] ; 获取 第 6 个 参数 
2 最 后 两 个 参数 都 是 无 符号 16 位 整数 ， 因 此 将 这 两 个 参数 做 清 零 高 位 扩展 


; 使 得 高 48 位 比特 都 为 


movzx rcx, cx 
movzx  r8, r8w 


sub rcx, r8 
idiv recx 
ret 
MyFunc2 endp 
end 


这 里 大 家 可 以 看 天 Windows 系 统 在 x86 人 处 理 絮 64 位 模式 下 参数 传递 
情况 。 此 外 ， 压 入 函数 的 参数 也 是 由 函数 调用 者 自己 清理 ， 不 需要 由 
函数 实现 来 处 理 。 


最 后 笔者 对 于 函数 调用 约定 中 谁 负 责 清理 传 入 参数 的 栈 空间 这 个 
问题 上 发 表 一 些 个 人 看 法 。 各 位 感 兴趣 的 也 可 以 与 笔者 联系 大 家 共同 
探讨 。 尽 管 像 x86 处 理 器 在 32 位 下 的 _stdcall 与 _fastcall 函 数 调 用 约定 
中 由 函数 实现 负责 清理 传 入 参数 所 占 的 栈 空 间 ， 从 而 会 节省 一 些 运 行 


时 开销 。 但 其 实 从 工程 学 角度 来 看 ， 这 是 一 个 不 对 称 行为 。 这 就 相当 
于 函数 调用 着 分 配 的 空间 ， 但 由 函数 实现 去 回收 ， 所 以 在 64 位 模式 的 
函数 调用 约定 中 ， 采 用 的 是 类 似 _cdecl 函 数 调用 约定 的 做 法 。 此 外 ， 
像 Apple 在 对 象 引 用 计数 管理 方面 也 是 做 了 这 人 么 一 个 规定 : 是 你 分 配 的 
束 由 你 去 释放 ; 不 是 由 你 分 配 的 ， 则 不 用 你 去 释放 。 


15.2 ”Unix/Linux 操 作 系 统 环 境 下 x86 处 理 需 的 函 
数 调用 约定 


Unix/Linux 操 作 系 统 环境 下 ，x86 处 理 器 在 32 位 执行 模式 下 的 C 画 数 
调用 约定 与 Windows 操 作 系统 上 的 相差 不 多 。 只 不 过 在 Unix/Linux 系 统 
上 规定 ， 在 函数 调用 处 ， 栈 指针 所 指 的 栈 空间 地 址 必须 是 16 字 节 对 齐 
的 。 此 外 ， 对 于 各 种 数据 类 型 的 对 齐 也 做 了 相关 规定 ， 在 32 位 模式 
下 ， 单 字 节 整数 以 1 个 字 节 对 齐 ;， 双 字 节 整数 以 2 个 字 市 对 齐 ; 其 他 所 
有 整数 与 浮 点 类 型 都 是 4 字 节 对 齐 的 ， 除 了 long double 是 16 字 节 对 齐 之 
Wh 


在 Unix 系 操作 系统 中 ， 通 常 使 用 GCC 或 Clang 作 为 编译 器 ， 这 些 编 
译 句 也 提供 了 x86 处 理 器 在 32 位 模式 下 的 三 种 函数 调用 约定 ， 只 不 过 辑 
数 调用 约定 限定 符 用 的 是 _attribute “来 声明 的 (在 第 17 章 中 做 详细 介 
绍 ) 。 上 默认 的 画 数 调用 约定 仍然 是 cdecl， 即 C 画 数 调 用 约定 ， 如 果 我 们 
通过 显 式 声 明 的 话 ， 可 以 用 诸如 void_attribute ( (cdecl) ) foo 
(void) ; 来 声明 。 此 外 ，stdcall 与 fastcall 也 一 样 ， 分 别 通 过 
attribute  ( (stdcall) ) 与 _attribute  ( (fastcall) ) 来 声明 。 


64 位 执行 模式 下 则 与 Windows 的 完全 不 同 了 。Unix 系 操作 系统 在 
X86 处 理 器 64 位 执行 模式 下 遵循 的 是 针对 AMD64 架 构 的 System-V (这 里 


的 V 表 示 罗 马 数字 5， 不 是 英文 字母 ) ABI。 在 64 位 模式 下 ，long 以 及 
long long 类 型 都 是 64 位 的 ， 并 且 它 们 也 要 求 以 8 字 贡 对齐。 本 数 实现 需 
要 自己 保存 的 通用 目的 寄存 器 有 RBX、RBP、R12、R13、R14、R15， 
其 他 通用 寄存 器 都 由 函数 调用 者 去 维护 。 而 在 函数 调用 上 ，System-V 
ABI 则 能 将 更 多 的 整数 参数 通过 通用 目的 寄存 器 做 参数 传递 ， 从 左 到 右 
依次 放 入 RDI、RSI、RDX、RCX、R8 与 R9。 


下 面 举 一 个 与 代码 清单 15-3 相 同 的 例子 来 看 看 macOS 下 使 用 64 位 执 
行程 序 的 函数 调用 约定 使 用 情况 。 在 macOS 下 ， 我 们 使 用 Xcode， 用 黑 
认 选 项 配置 即 可 ， 十 分 方便 。 我 们 还 是 在 生成 的 工程 中 使 用 main.c 源 文 
件 ， 汇 编 源 文件 用 func.s， 在 GCC 与 Clang 编 译 器 中 ， 汇 编 源 文件 通常 
用 .s 作 为 后 缀 名 的 文件 。 用 Xcode 新 建 汇编 文件 非常 方便 ， 直 接 在 
macOS 一 位 中 将 深 动 条 拉动 到 最 下 面 找到 Other 一 栏 ， 然 后 选 


中 “Assembly File" 即 可 ， 如 图 15-9 所 示 。 


| © Filter 
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Configuration PCH File 
Settings File 


图 15-9 ”用 Xcode 新 建 汇 编 源 文件 
代码 清单 15-5 给 出 与 15-3 相 应 的 汇编 源 文件 。 


代码 清单 15-5 ”macOS 下 实现 与 代码 清单 15-4 相 同 效果 的 汇编 代码 


// func.s 


.text 
.align 4 


.globl] _MyFunc1，_MyFunc2 
_MyFunci1: 


// 将 第 二 个 参数 与 第 四 个 参数 做 带 符号 扩展 
moVvSsx %si, %rsi 
movSX  %cx, %rcx 


sub %rsi，%rdi // 第 一 个 参数 减 去 第 二 个 参数 ， 差 存 入 RDI 
sub %rcx，%rdx // 第 三 个 参数 减 去 第 四 个 参数 ， 差 存 入 RDX 
mov %rdi，%rax // 将 第 一 个 差 值 放 入 RAX 作 为 被 除数 

mov %rdx，%rcx // 将 第 二 个 差 值 放 入 RCX 作 为 除数 


xor %rdx，%rdx // 清空 RDX 寄 存 器 ， 作 为 被 除数 高 位 
idiv %rCX 


ret 


_MyFunc2: 

add %rsi, %rdi 
add %rcx, %rdx 
add %rdx, %rdi 
movzx  %r8w, %r8 
movzx  %r9w, %r9 
sub %r9, %r8 
mov %rdi, %rax 
xor %rdx, %rdx 
idiv %r8 
ret 

在 Linux 环 境 


二 


// 将 第 一 个 参数 与 第 二 个 参数 相 加 ， 结 果 存 入 RDI 
// 将 第 三 个 参数 与 第 四 个 参数 相 加 ， 结 果 存 入 RDX 
/7 将 两 个 求 和 结果 相 加 ， 结 果 存 入 RDI 寄 存 名 


// et 
// 无 符号 扩展 第 六 个 参数 
// 将 第 5 个 参数 减 类 第 6 个 参数 的 值 ， 存 入 R8 作 为 除数 


将 求 和 结果 放 入 RAX 作 为 被 除数 
// 清空 RDX 寄 存 器 ， 作 为 被 除数 高 位 


2 


包括 Android 编 译 环境 下 ) ，GAS 汇 编 器 现在 已 经 


不 要 求 C 语 言 的 外 部 函数 符号 在 汇编 代码 中 需要 显 式 加 上 前 导 _ 符 号 ， 
汇编 器 会 默认 加 上 。 因 此 上 述 汇 编 代 码 如 果 拿 到 Linux 或 Android 上 编译 
的 话 ， 我 们 必须 将 _MyFunc1 和 _MyFunc2 前 面 的 下 划 线 给 去 掉 。 


15.3 ”ARM 处 理 硕 环境 下 的 函数 调用 约定 


由 于 ARM 处 理 器 由 ARM 官 方 定义 了 其 函数 调用 约定 ， 所 以 对 于 
各 类 骸 入 式 系 统 以 及 操作 系统 ， 基 本 都 按照 ARM 官 方 制定 的 调用 约定 
进行 实现 ， 当 然 有 些 系统 会 在 此 基础 上 做 一 些 扩 展 。 尽 管 大 部 分 ARM 
处 理 器 都 是 32 位 的 ， 不 过 现在 ARMv8 架 构 处 理 器 也 有 32 位 执行 模式 与 
64 位 执行 模式 ，ARM 官 方 分 别 将 它们 称 为 AArch32 与 AArch64。 下 面 
我 们 分 别 对 AArch32 与 AArch64 的 函数 调用 约定 进行 介绍 。 


15.3.1 AArch32 染 构 环 境 下 的 范 数 调用 约定 


在 AArch32 架 构 体 系 下 ，ARM 处 理 器 可 访问 16 个 通用 目的 寄存 器 
R0~R15， 其 中 R13 作 为 栈 指针 寄存 器 (SP) ，R14 作 为 连接 寄存 器 
(LR) 用 于 存放 画 数 返 回 地 址 ，R15 作 为 程序 计数 寄存 器 (PC) 。 这 
里 ，R14 通 常 也 能 作为 通用 目的 寄存 器 来 使 用 ， 所 以 我 们 一 般 能 用 R0 
~R12 以 及 R14 这 14 个 通用 目的 寄存 种 。 这 里 需要 注意 的 是 R9 寄 存 器 ， 
R9 寄 存 器 在 不 同 环 境 所 扮演 的 角色 可 能 会 不 太一 样 。 在 某 些 租 入 式 平 
台 上 ， 如 果 将 代码 编译 为 地 址 无 关 的 (position-independent) ， 那 么 
R9 将 作为 静态 基地 址 寄存 器 而 使 用 ， 这 时 当 我 们 在 函数 中 要 访问 全 局 
数据 对 象 的 时 候 就 需要 用 R9 加 上 此 数据 对 象 所 在 的 偏 移 来 定位 真正 的 


物理 地 址 ， 像 ADS1.2、RVCT4.0 这 些 编译 需 编译 出 来 的 地 址 无 天 的 代 
码 都 会 将 R9 作 为 静态 基地 址 寄存 促使 用 ， 所 以 我 们 不 能 在 代码 中 目 己 
使 用 R9 寄 存 器 。 此 外 ，R9 寄 存 器 也 有 可 能 被 用 于 线程 寄存 器 ， 比 如 用 
于 访问 C11 标 准 中 的 _Thread_local 对 象 ， 所 以 各 位 在 使 用 R9 寄 存 器 的 
时 候 需 要 注意 各 个 平台 上 的 相关 文档 ， 以 人 免 误 用 而 引发 程序 异常 、 崩 
溃 的 现象 。 在 iOS、Android 系 统 中 ，R9 寄 存 器 都 没有 特殊 用 途 ， 各 位 
可 以 放心 将 它 视 为 通用 目的 寄存 器 来 使 用 。 


在 AArch32 架 构 环 境 下 ， 需 要 函数 实现 自己 保存 的 寄存 器 有 R4 一 
R11 以 及 R14。R12 寄 存 器 可 用 作 过 程 间 调 用 的 共享 寄存 器 。 比 如 ， 我 
在 子 过 程 A 中 需要 传递 一 个 值 给 子 过程 B 使 用 ， 那 么 可 以 将 这 个 值 保存 
在 R11 中 ， 子 过 程 B 即 可 直接 通过 访问 寄存 器 R11 而 获取 到 。 所 谓 子 过 
程 (Procedure 或 Routine) 就 是 我 们 用 汇编 写 的 函数 实现 ， 它 与 C 函 数 
的 区 别 不 仅仅 是 在 语言 层面 上 ， 而 且 在 实现 上 更 为 灵活 ， 能 自己 制定 
各 类 数据 的 传递 方式 以 及 跳 转 方式 。C 画 数 所 生成 的 代码 会 有 更 多 的 
规定 与 约束 。 


在 AArch32 架 构 环 境 下 ， 画 数 调 用 前 的 参数 传递 规则 是 : 对 于 前 4 
个 不 超过 32 位 的 整数 参数 ， 从 左 到 右 依次 放 入 R0~R3 寄 存 器 ， 后 续 参 
数 根据 特定 环境 从 右 到 左 依次 压 入 栈 中 ， 不 同 环境 对 函数 调用 前 的 栈 
指针 地 址 的 对 齐 要 求 可 能 会 不 同 ， 但 一 般 在 类 Unix 系 操作 系统 中 ， 都 
要 求 8 字 节 或 16 字 节 对 齐 。 


下 面 我 们 还 是 以 代码 清单 15-3 的 C 代 码 作 为 样本 来 做 AArch32 架 构 
下 ioOS 系 统 环境 的 函数 调用 约定 的 测试 。 用 iOS 来 做 函数 调用 约定 的 测 
斌 十 分 方便 ， 我 们 用 Xcode 创建 一 个 iOS 的 Single View Application 项 目 
模板 ， 然 后 在 工程 里 添加 一 个 func.s 的 汇编 源 文件 即 可 。 在 iOS 项 目 工 
程 中 添加 func.s 的 时 候 与 macOS 工 程 类 似 ， 在 i0S 一 栏 里 的 Others 分 类 
能 找到 Assembly File， 选 择 它 ， 然 后 将 文件 名 命名 为 func 即 可 。 随 
后 ， 我 们 可 以 直接 在 ViewController.m 里 做 测试 ， 如 代码 清单 15-6 所 
示 。 由 于 ViewController.m 是 一 个 Objective-C 源 文件 ， 所 以 是 以 .m 作 为 
后 缀 名 结尾 的 ， 但 各 位 不 用 担心 ，Objective-C 完 全 兼容 C 语 言 ， 它 是 
货真价实 的 C 语 言 的 超 类 ， 这 与 C++ 对 C 语 言 做 兼容 还 不 一 样 。 


代码 清单 15-6” ”iOS 工程 中 的 ViewController.m 产 文件 代码 


// ViewController.m 
// arm_test 


#import "ViewController.h" 
@interface ViewController () 
@end 

/xx 


* 村 


由 于 AArch32 架 构 下 ，ARM-A 的 指令 集中 没有 整数 除法 指令 ， 
* 所 以 这 里 我 们 自己 定义 一 个 全 局 外 部 函数 来 定义 一 个 通用 的 除法 函数 
*/ 

int MyDivide(int dividend, int divisor) 


return dividend / divisor,; 


// 执行 (a - b) / (c - d) 操 作 a 
// size_t 在 32 位 执行 模式 下 是 32 位 ，64 位 执行 模式 下 为 64 位 
extern int MyFunci(size t a, int8_t b, int32_t c, int16_t d)， 


// 执行 (a + b + c + d) / (e - ff) 操作 
extern int MyFunc2(int a, int b, int c, int d, int16 t e, int16_t f); 


@implementation ViewController 


(void)viewDidLoad { 


[super ViewDidLoad] 


int result = MyFunc1i(12, 4, 3, -1); 
printf("MyFunci division result: %d\n", result); 


result = MyFunc2(10, 20, 30, 60, 70, 50); 
printf("MyFunc2 division result: %d\n", result); 


Q@end 


由 于 ARM 人 处 理 絮 从 ARMv4 架 构 一 直到 ARMv7-AM 染 构 中 不 包含 
整数 除法 指令 ， 只 有 ARMv7-R 才 包含 ， 所 以 我 这 里 定义 名 为 
MyDivision 函 数 来 做 通用 的 整数 除法 操作 。 下 面 我 们 通过 代码 清单 15- 
7 来 看 对 应 的 MyFunc1l 与 MyFunc2 的 函数 实现 。 


代码 清单 15-7 iOS 工 程 中 在 32 位 模式 下 对 MyFuncl 与 MyFunc2 函 
数 的 实现 


// 
// func.s 
// armv7_test 


‘text 
.align 4 


.globl _MyFunci, _MyFunc2 
.globl] _MyDivide 


#ifdef _ arm _ 
.arm 
_MyFunc1: 


// 这 里 压 入 两 个 寄存 器 ， 以 保持 栈 空 间 始终 以 8 字 节 对 齐 
push {r4, lr} 


sub r9，rg，r1 // 将 第 一 个 参数 与 第 二 个 参数 相 减 ， 结 果 放 入 R9 寄 存 器 
sub r1，r2，r3 // 将 第 三 个 参数 与 第 四 个 参数 相 减 ， 结 果 存 入 R1 寄 存 器 
blx _MyDivide  ”// 调用 MyDivide 函 数 ， 执 行 除法 计算 
pop {r4, pc} 

_MyFunc2: 


push {r4, lr} 


add r9，rg，rl1 // 将 第 一 个 参数 与 第 二 0 结果 放 入 R90 寄存 器 
add r2，r2，r3 // 将 第 二 个 参数 与 第 三 个 参数 相 加 ， 结 果 放 入 R2 寄 存 器 


add r9，r9，r2 // 将 两 个 求 和 结果 再 次 相 加 ， 结果 放 入 R6 寄 窜 器 
ldr r4, [sp, #8] J 读 取 第 5 个 参数 放 入 R4 寄 存 器 
ldr r12， [sp, #12] 读 取 第 6 个 参数 放 入 R12 寄存 器 
sub ri, r4, r12 // 将 第 6 个 参数 瑟 第 6 个 参 委 呈 并 结果 放 入 R1 寄 存 器 
blx _MyDivide ”// 调用 MyDivide 函 数 ， 执 行 除法 计算 
pop {r4, pc} 

#endif 


从 代码 清单 15-7 中 我 们 可 以 看 到 ，ARM 指 令 集 对 于 这 两 个 函数 的 
实现 指令 非常 精简 ， 参 数 传递 机 制 与 x86 的 也 比较 相似 ， 先 将 前 4 个 整 
数 参 数 传 入 寄存 器 ， 更 多 的 参数 以 从 石 到 左 的 次 友 压 入 栈 中 。 并 且 压 
入 参数 的 栈 空间 最 后 也 是 由 函数 调用 者 回收 ， 画 数 实现 无 需 关心 。 


此 外 ， 如 果 各 位 在 Android 系 统 下 试验 的 话 ， 那 么 在 汇编 源 文件 中 
需要 把 函数 标识 符 的 前 导 下 划 线 _ 给 删除 。 


最 后 提 一 点 ， 如 采 当 前 ARMV7 架 构 处 理 器 文 持 NEON 反 术 的 话 ， 
那么 在 iOS 系 统 中 如 果 在 函数 实现 中 使 用 了 向 量 寄 存 右 ， 束 需要 将 Q4 
一 Q7 这 4 个 向 量 寄 存 右 保存 到 栈 中 。 


15.3.2 ”AArch64 染 构 环境 下 的 函数 调用 约定 


从 ARMv8 架 构 起 ，ARM 人 处 理 絮 进入 了 64 位 上 时代。ARMv8 架 构 处 
理 器 与 x86 处 理 器 类 似 ， 能 同时 支持 32 位 的 ARMv7 架 构 的 指令 集 ， 即 


AArch32 模 式 ， 以 及 64 位 的 指令 集 ， 即 AArch64 模 式 。 在 15.3.1 记 中 已 
经 介绍 了 AArch32 模 式 下 的 函数 调用 约定 ， 这 里 将 介绍 AArch64 架 构 环 
境 下 的 函数 调用 约定 。 


在 AArch64 模 式 下 ，ARM 处 理 器 可 用 的 通用 目的 寄存 器 数量 从 16 
个 增加 到 32 个 ， 分 别 为 RO~R31。 其 中 原来 AArch32 中 的 PC 寄存 器 已 
经 不 显 式 地 给 出 了 ， 它 作为 系统 隐藏 的 寄存 器 而 不 开放 到 ISA 中 。 这 
里 ，R31 作 为 栈 指针 寄存 器 (SP) ，R30 作 为 连接 寄存 器 (LR) 以 存 
放 男 数 返 回 地 址 。 这 些 通用 目的 寄存 器 中 ，R19~~R28 需 要 由 函数 实现 
来 保存 。 此 外 ，ARMv8 架 构 必 须 文 持 SIMD 技 术 ， 因 此 它 也 包 合 了 32 
个 向 量 寄存 器 ， 分 别 为 V0~~V31。 其 中 ，V8~V15 需 要 由 画 数 实现 自 
己 保 存 。 


由 于 有 充足 的 通用 目的 寄存 器 ，AArch64 模 式 下 参数 传递 能 让 更 
多 整数 参数 放 入 寄存 器 中 。 其 中 前 8 个 整数 参数 分 别 存 入 R0~R7 寄 存 
器 ， 后 续 更 多 参数 才 压 入 栈 中 。 此 外 ，AArch64 中 ， 压 入 参数 的 栈 空 
间 也 是 由 函数 调用 者 来 回收 ， 函 数 实现 无 需 关 心 。 


在 iOS 系 统 下 ，R18 寄 存 器 用 于 系统 特殊 功能 使 用 ， 所 以 我 们 在 用 
汇编 目 己 实 现 函 数 的 时 候 不 能 对 它 进 行使 用 。 


代码 清单 15-8 也 是 根据 代码 清单 15-6 的 Objective-C 源 文件 来 完成 
AArch64 架 构 下 的 函数 实现 。 


代码 清单 15-8 ” ”iOS 工程 中 在 64 位 模式 下 对 MyFuncl 与 MyFunc2 函 


数 的 实现 


// 


// func.s 


// armv8_test 


.text 


.align 4 


.globl _MyFunci, _MyFunc2 


#ifdef 


_MyFunc1: 


sxtb 
sxth 
sub 
sub 
sdiv 


ret 


_MyFunc2: 


sxth 
sxth 
add 
add 
add 


sub 
sdiv 


ret 


#endif 


x1, 
x3, 
x0, 
x2, 
x0, 


x4, 
x5, 
x0, 
x2, 
x0, 


x4, 
xg， 


__arm64 _ 


wi 
Ww3 

x0, 
x2, 
x0, 


w4 
Ww5 

x0, 
x2, 
x0, 


x4, 
x9, 


XI 
X3 
X2 


带 符号 扩展 第 2 个 参数 


放 入 X0 寄 存 器 


村 [上 ， 结 
将 第 2 个 参数 与 第 3 个 参数 相 加 ， 结 果 放 入 X2 寄 存 器 
将 第 1 个 差 值 除 以 第 2 个 差 值 ， 结 果 放 入 X0 


将 第 1 个 参数 与 第 2 个 参数 相 加 ， 结 果 存 入 X9 寄 存 器 
将 第 3 个 参数 与 第 4 个 参数 相 加 ， 结 果 存 入 X2 寄 存 器 
将 第 5 个 参数 与 第 6 个 参数 相 减 ， 结 果 存 入 X4 寄 存 器 


代码 请 单 15-8 与 代码 清单 15-7 可 以 合并 为 一 个 汇编 源 文 件 ， 因 为 
过 编译 絮 预 定义 的 宏 来 判定 当前 编译 环境 是 AArch32 模 


这 里 面 已 经 通 
式 还 是 AArch64 模 式 


。 _arm 表示 AArch32 模 式 ， 


”arm64 ”表示 


AArch64 模 式 。 对 于 iOS 设 备 ， 从 iPod Touch 6、iPhone 5S 起 ，iPad Air 


与 iPad mini 2 起 用 的 都 是 64 位 Apple A 处 理 虱 


即 从 Apple A7 开 始 的 处 


理 器 都 是 ARMv8 架 构 的 、 支 持 AArch64 执 行 模式 ， 而 之 前 的 处 理 器 都 
只 能 用 AArch32 执 行 模式 。 


15.4 本 草 小 结 


本 章 措 述 了 在 Windows 操 作 系 统 以 及 Unix 系 操作 系统 下 x86 处 理 硕 
与 ARM 处 理 避 的 函数 调用 约定 。 大 部 分 应 用 程序 员 可 能 并 不 需要 关心 
玉 数 调用 约定 ， 但 是 编译 络 实 现 者 、 高 性 能 计算 、 敬 入 式 系 统 等 领域 
的 程序 员 则 需要 关心 。 这 里 面 牵 涉 不 同 编程 语言 、 不 同 编译 器 所 编译 
出 的 二 进 制 兼容 性 问题 ， 另 外 还 有 很 关键 的 是 C 语 言 与 汇编 语言 如 何 
相互 调用 问题 ， 这 对 于 高 性 能 计算 的 开发 人 员 以 及 租 入 式 系统 开发 人 
员 来 说 就 显得 格外 重要 了 。 


本 章 包 含 了 大 量 汇 编 语言 代码 ， 这 里 不 要 求 大 家 能 对 此 深入 研 完 
多 少 ， 如 采 各 位 不 从 事 比较 专业 领域 的 开发 的 话 ， 只 需要 了 解 即 可 ， 
因此 在 示例 代码 中 也 仪 仅 使 用 加 减 乘除 这 些 基本 的 算术 运算 ,不 涉及 
太 多 复杂 的 指令 。 不 管 坚 么 说 ， 通 过 对 本 章 的 学 习 ， 各 位 至 少 能 对 男 
数 调用 过 程 ， 包 括 如 何 传 参 、 如 何 把 结果 返回 、 栈 指针 在 函数 调用 前 
后 是 如 何 移 动 的 .…... 会 有 更 深刻 的 理解 ， 这 对 于 学 习 C 语 言 本 身 来 说 
也 是 很 有 帮助 的 。 


第 16 章 ”创建 静态 库 与 动态 库 


在 第 15 革 各 位 已 经 了 解 了 C 语 言 贸 数 的 ABI。 如 果菜 些 系 统 具 有 相 
互 兼 容 的 ABI， 那 么 对 于 兼容 C 语 言 标准 库 的 系统 环境 ， 我 们 可 以 使 用 
相同 的 静态 库 ， 甚 至 是 动态 库 。 静 态 库 与 动态 库 统称 为 库 文 件 ， 它 们 
征用 于 提供 给 应 用 程序 连接 所 使 用 的 打包 好 的 一 种 二 进 制 中 间 文 件 。 
库 文 件 是 一 个 较为 完整 的 目标 文件 的 集合 ， 我 们 可 以 在 一 个 系统 环境 
中 创建 一 个 用 于 创建 静态 库 或 动态 库 的 工程 ， 然 后 将 工程 中 的 所 有 源 
文件 进行 编译 、 打 包 输 出 为 静态 库 或 动态 库 文件 。 


静态 库 文件 是 参与 整个 应 用 程序 一 起 连接 的 库 文 件 。 根 据 特 定 实 
现 ， 静 仿 库 可 不 做 符号 连接 ， 也 可 做 部 分 连接 ， 不 过 无 论 是 哪 种 实 
现 ， 静 态 库 文件 中 允许 存在 未 解决 的 符号 
没有 在 打包 静态 库 的 工程 中 定义 的 某 些 具有 外 部 连接 的 全 局 对 象 和 画 
数 ， 而 这 些 具有 外 部 连接 的 全 局 对 象 和 函数 在 静态 库 中 的 某 处 被 引用 
了 。 


(unresolved symbol) ， 即 


动态 库 与 静态 库 不 同 的 是 : 它 是 在 程序 加 载 时 ， 或 在 运行 时 进行 
加 载 相关 符号 ， 因 此 动态 库 必 须 进 行 完整 的 连接 处 理 。 如 末 我 们 在 一 
个 应 用 程序 中 ， 通 过 在 运行 时 加 载 动态 库 中 特定 的 全 局 函数 或 全 局 对 
象 ， 那 么 我 们 将 通过 当前 系统 环境 特定 的 系统 调用 进行 。 


下 面 ， 我 们 将 分 别针 对 Windows、macOS 以 及 Linux 系 统 来 讲解 在 
这 些 操作 系统 中 如 何 创 建 静 态 库 与 动态 库 ， 并 且 如 何 使 用 静态 库 和 动 


16.1 Windows 系 统 下 创建 静态 库 与 动态 库 


由 于 在 Windows 系 统 下 ， 我 们 用 Visual Studio 开 发 工具 更 多 一 些 ， 
所 以 这 里 将 主要 介绍 如 何 通 过 Visual Studio 2017 Community 来 创建 静态 
库 与 动态 库 ， 然 后 在 主 应 用 程序 中 使 用 这 些 库 。 各 位 如 果 没 有 2017 版 
本 ， 那 么 使 用 2015、2013 版 也 差不多 。 


16.1.1 Windows 系 统 下 创建 并 使 用 静态 库 


我 们 首先 打开 Visual Studio， 然 后 准备 创建 一 个 Win32 控 制 台 应 用 
程序 ， 如 图 16-1 所 示 。 


国 ll ”Win32 控制 应 用 程序 


4 模板 4 中 
4 Visual C++ Win32 项 目 


b Cross Platform 


”其 他 项 目 类 型 


未 找到 你 要 查找 的 内 容 ? 
打开 Visual Studio 安装 程序 


b 联机 


staticLibTest 


图 16-1 ”选择 Win32 控 制 台 应 用 程序 


随后 ， 我 们 填写 项 目 名 为 staticLibTest， 点 击 “ 下 一 步 * 到 下 一 个 界 
面 。 


在 下 一 个 界面 中 ， 我 们 先 点 击 “ 应 用 程序 设置 "， 设 置 应 用 属性 。 
这 里 ， 在 “应 用 程序 类 型 * 中 选择 “静态 库 ” 单 选 按钮 ， 表 示 我 们 要 创建 的 
苹 一 个 静态 库 工 程 。 在 “附加 选项 ”中 把 所 有 选项 都 取消 ， 如 图 16-2 所 


人 小， 


应 用 程序 类 型 : 
应 用 程序 设置 〇 和 ndows 应 用 程序 名 ) 
O 〇 控制 台 应 用 程序 (0) 


C 〇 DLLO) 


@) 静态 库 (Ss) 
附加 选项 : 
品 空 区 目 (E) 
写 出 付 写 (X) 


虽 3 观 编 译 头 (F) 


图 16-2 ”创建 静态 库 工程 


最 后 ， 我 们 点 击 “ 完 成 ”按钮 ， 进 入 工程 主 界 面 。 我 们 在 右 侧 找 
到 “ 源 文件 ”文件 来， 鼠标 右键 点 击 它 ， 然 后 选择 “添加 ”， 再 点 击 “ 新 建 
项 ”， 然后 我 们 在 左 侧 选 择 “ 代 码 ”， 再 点 击 “C++File” 之 后 ， 在 “名 称 ” 文 
本 框 中 输入 ib.c”。 最 后 护 击 “添加 ”按钮 。 这 样 我 们 整 能 看 到 一 个 文本 
编辑 框 ， 这 里 就 能 编写 lib.c 源 文件 中 的 C 代 码 了 。 


静态 库 中 的 C 代 码 见 代码 清单 16-1。 


代码 清单 16-1 鹃 态 库 的 C 代 码 


#include i h> 
// 此 函数 将 7 程序 中 定义 ， 当 前 库 中 不 解决 此 符号 
extern vend ainpunctlont God 


// 在 静态 库 中 定义 了 其 有 内 部 连接 的 绩 数 InnerFunction,， : 
// 它 对 主 应 用 程序 的 符号 连接 没有 任何 影响 ， 仅 作用 于 静态 库 项 目 中 的 当前 源 文件 
static int InnerFunction(void) 


puts("This is a static library inner function!"); 


return 10; 


} 


// 在 静态 库 中 定义 了 StaticLibTest 具 有 外 部 连接 的 全 局 函数 
void StaticLibTest(int a) 


// 调用 了 MainFunction， 即 对 MainFunction 符 号 进行 了 引用 。 
// 因此 必须 在 主 应 用 程序 中 对 MainFunction 进 行 定义 ， 否 则 主 应 用 程序 将 通 不 过 连接 
MainFunction(); 


int b = InnerFunction(); 
printf("value = %d\n", a + b); 


我 们 编写 完 上 述 代 码 之 后 ， 在 菜单 栏 找 到 “生成 ”按钮 ， 然 后 点 击 
之 后 选择 “生成 解决 方案 *， 这 样 在 我 们 项 目 工 程 文 件 夹 的 Debug 目 杂 中 
就 会 出 现 staticlibTest.lib 文 件 了 。 


接 下 来 ， 要 创建 主 工程 目录 了 。 一 开始 与 图 16-1 一 样 ， 选 择 Win32 
控制 台 应 用 程序 。 然 后 在 “应 用 程序 类 型 "中 ， 选 择 “ 控 制 台 应 用 程序 ”， 
然后 同样 , “附加 选项 ”中 不 选中 任何 选项 。 点 击 “ 完 成 "按钮 则 创建 好 了 
当前 的 主 应 用 程序 项 目 工 程 。 


然后 在 编辑 界面 ， 我 们 仍然 在 “ 源 文 件 ” 文 件 夹 处 鼠标 右键 点 击 一 
下 ， 然 后 选择 “添加 *"， 再 选择 “新 建 项 *， 然 后 创建 一 个 名 为 main.c 的 源 
文件 。 随 后 ， 我 们 把 刚才 得 到 的 staticlibTest.lib 文 件 放 入 当前 工程 中 
main.c 所 在 的 目录 下 。 我 们 回 到 Visual Studio， 再 右 击 “Source Files”， 
选择 “添加 *”， 然 后 再 选择 “ 现 有 项 *”， 在 弹出 的 文件 选择 对 话 框 中 选中 


staticlibTest.lib， 最 后 点 击 “ 深 加 ”按钮 ， 则 把 staticlibTest.lib 静 仿 库 文件 
也 加 入 到 了 “ 源 文 件 * 文 件 夹 中 了 ， 如 图 16-3 所 示 。 


4 [S|] cdemo 
a 图 弓 | 用 
呈 外 部 依 款项 
出 头 文件 


中 | 源 文 件 
> ++ main.c 

gl staticLibTest.lib 
咽 资源 文件 


图 16-3 ”添加 静态 库 文件 
接 下 来 ， 我 们 在 main.c 文 件 中 输入 代码 清单 16-2 中 所 示 的 代码 。 
代码 清单 16-2 ” 主 程 序 源 代码 


#include <stdio.h> 


// 在 主 函 数 中 定义 具有 外 部 连接 的 全 局 函数 MainFunction 
void MainFunction(void) 


puts("This is a function in main project!"); 


// 在 主 应 用 程序 中 定义 具有 内 部 连接 的 静态 函数 InnerFunction 
static int InnerFunction(void) 


puts("This is an inner function in main!"); 
return 200 


// 声明 定义 在 静态 库 中 的 具有 外 部 连接 的 全 局 函数 StaticLibTest 
extern void StaticLibTest(int a); 


int main(void) 
StaticLibTest(1); 


int a = InnerFunction(); 
printf("a = %d\n", a) 


getchar(); 


输入 完成 后 ， 这 次 我 们 可 以 点 击 工具 栏 中 的 绿色 小 三 角 按钮 ， 
编译 器 编译 、 连 接 后 直接 运行 。 此 时 连接 器 会 把 main.c 生 成 的 目标 文件 
与 静态 库 staticlibTest.lib 文 件 做 总 和 连接 ， 从 而 解决 所 有 外 部 符号 ， 最 
终生 成 可 执行 文件 。 如 果 代 码 没有 输入 错误 ， 整 个 程序 能 直接 跑 起 


来 。 


这 里 我 们 可 以 看 到 ， 在 main.c 源 文件 中 定义 了 静态 库 中 所 引用 到 的 
MainFunction 函 数 。 此 外 ， 在 main 函 数 中 则 调用 了 在 静态 库 中 定义 的 
StaticLibTest 函 数 。 而 静态 库 中 与 main 中 所 定义 的 InnerFunction 函 数 都 

它们 各 目 独 有 的 ， 因 此 相互 之 间 没 有 任何 影响 。 对 静态 库 中 符号 的 
连接 主要 针对 具有 外 部 连接 的 符号 。 


16.1.2 Windows 系 统 上 创建 并 使 用 动态 库 


动态 库 又 称 为 动态 连接 库 ， 是 指 应 用 程序 在 局 动 前 被 加 载 时 或 在 
运行 时 加 载 的 连接 库 。 它 的 优点 是 无 需 重 新 连接 所 有 的 库 从 而 重新 生 
成 新 的 可 执行 文件 ， 而 是 只 需 替换 当前 功能 模块 对 应 的 动态 连接 库 文 
件 。 这 样 分 发 给 最 终 用 户 的 时 候 ， 或 者 更 新 应 用 时 无 需 把 整个 可 执行 
文件 全 都 连接 更 新 一 过 ， 而 只 需要 提供 修改 过 的 功能 模块 所 对 应 的 动 
态 连 接 库 文件 ， 只 要 当 应 用 程序 启动 执行 时 即 可 产生 更 新 后 的 效果 。 


在 Windows 系 统 上 ， 我 们 对 于 “补丁 ”这 个 词 已 经 是 耳熟能详 了 ， 而 
应 用 程序 的 “4 稚 丁 ” 往 往 就 是 通过 更 新 动态 库 文 件 来 实现 的 ， 而 不 需要 
更 新 可 执行 文件 本 身 。 下 面 我 们 就 来 介绍 如 何 通过 Visual Studio 2017 
Community 来 构建 我 们 目 己 的 动态 库 文件 。 


首先， 我 们 仍然 根据 图 16-1 创 建 一 个 Win32 控 制 台 工程 ， 名 字 为 
dllTest。 然 后 ， 右 击 “ 应 用 程序 设置 ”中 ， 在 “应 用 程序 类 型 ”一 栏 选择 
DLL; 在 “附加 选项 ”中 取消 勾 选 其 他 远 项 ， 而 义 选 上 “ 空 项 目 ”， 如 图 


16-4 所 示 。 


应 用 程序 类 型 : 
应 用 程序 设置 〇 和 ndows 应 用 程序 出 ) 
O 〇 控制 台 应 用 程序 ‘0) 


〇 静态 库 (s) 


' 附 加 选项 : 
空 项 目 (E) 


唱 福 出 竺 写 以 ) 
国 预 编 幸 头 (f) 


图 16-4 设置 DLL 工程 


这 里 大 家 一 定 要 勾 选 上 “ 空 项 目 ”， 否 则 DLL 项 目 工 程 会 目 动 导入 一 


些 杂 七 杂 八 的 头 文件 与 资源 文件 ， 使 得 我 们 后 期 构建 的 动态 库 文件 无 


法 正常 工作 * 


最 后 点击 “完成 * 即 可 创建 好 一 个 DLL 工 程 项 目 。 这 里 我 们 类 似 地 


在 “ 源 文 件 ” 文 件 夹 中 创建 一 个 名 为 ”dll.c” 的 源 文件 ， 然 后 融入 代码 清单 


16-3 所 示 的 代码 内 容 。 


代码 清单 16-3 ”动态 库 代 码 内 容 


#include <stdio.h> 


// 在 Windows 中 使 


__declspec(dllexport ) 来 指定 


用 
// 当前 的 醒 数 作为 可 被 动态 加 载 的 外 函数 


void _declspec(d1lexport) DLLFunction(int a) 


printf("This is a dll function! a = %d\n", a); 


// 这 个 函数 将 在 主 程序 中 将 以 运行 时 加 载 的 形式 进行 调用 
int _ declspec(dllexport) DLLLoadedFunction(void) 


puts("DLL loaded function is called!"); 
return 100; 


} 


在 Windows 中 使 用 了 一 个 C 语 言 扩 展 天 键 字 一 一 _declspec 
(dllexport) 函数 说 明 符 来 指明 当前 函数 可 被 动态 加 载 。_ declspec 
(dllexport) 只 能 用 于 修饰 具有 外 部 连接 的 全 局 函数 或 对 象 。 


另外 在 代码 清单 16-3 中 ， 画 数 DLLFunction 将 在 主 程序 加 载 时 被 加 
载 到 程序 内 存 中 ;， 而 函数 DLLLoadedFunction 将 在 运行 时 直接 通过 
Windows API 动 态 加 载 到 程序 内 存 中 ， 然 后 通过 函数 指针 做 间接 调用 。 


写 完 上 述 代 码 之 后 ， 我 们 同样 在 菜单 栏 找到 “生成 ”按钮 ， 点 击 之 
后 选择 “生成 解决 方案 *， 这 样 在 我 们 项 目 工 程 文件 夹 的 Debug 目 录 中 就 
会 同时 出 现 dllTest.lib 文 件 与 dllTest.dll 文 件 了 。 其 中 ，dllTest.lib 包 含 了 
函数 实现 本 体 ， 而 dlTest.dll 存 放 的 是 符号 映射 等 内 容 ， 所 以 两 者 都 需 
要 添加 到 主 程 序 的 工程 中 。Windows 中 ，dl 文 件 就 被 称 为 动态 连接 库 文 
件 。 


我 们 回 到 之 前 创建 好 的 main 工 程 ， 将 刚才 构建 得 到 的 dllTest.lib 文 
件 放 到 main.c 源 文件 所 在 的 工程 目 邓 下， 然后 再 将 dllTest.dll 青 复制 烙 贴 
到 工程 主 目录 下 的 Debug 目 杂 中 ， 与 生成 的 可 执行 文件 放 在 一 起 ， 由 于 


可 执行 文件 后 面 在 加 载 过 程 中 以 及 运行 时 查找 dllTest.dll 文 件 时 会 以 它 
所 在 的 目录 作为 默认 搜索 路 径 ， 这 么 处 理 显然 更 容易 些 。 随 后 将 之 前 
添加 好 的 staticlibTest.lib 文 件 删除 ， 将 新 增 的 dllTest.lib 文 件 添加 到 “ 源 文 
件 ” 文 件 夹 中 ， 如 图 16-5 所 示 。 


由] 解决 方案 "cdemo*(1 个 项 目 ) 
国 cdemo 
b we 引用 
b 上 踢 外 部 依赖 项 
呈 头 文件 


BE dllTest.lib 
pb ++ main.c 


, 亲 资源 文件 
3 » 


Windows (C:) » my programs » vc projects 


名 称 


国 cdemo.exe 
0 cdemo.ilk 
砚 cdemo.pdb 


八 


图 16-5 ”在 main 工 程 中 添加 dllTest.lib 并 将 dllTest.dl1 放 在 可 执行 文件 所 在 
目录 


这 里 dllTest.dll 无 需 添加 到 工程 中 ， 因 为 它 不 参与 连接 。 随 后 ， 我 
们 修改 main.c 的 内 容 ， 如 代码 清单 16-4 所 示 。 


代码 清单 16-4 Windows 动 态 加 载 d 的 main 源 文件 


#include <windows ,h> 
#include <stdio.h> 


// 用 _declspec(dllimport ) 声 明 当 前 函数 是 通过 加 载 器 在 加 载 程序 时 做 动态 库 连 接 的 
extern void __declspec(dllimport) DLLFunction(int a); 


int main(void) 


DLLFunction(100); ”// 这 里 可 以 直接 调用 加 载 时 载 入 的 DLLFunction 画 数 


// 使 用 Windows API 库 函数 LoadLibrary 动 态 加 载 dL11Test .d11 库 
HMODULE dllLibHandle = LoadLibrary(L"dllTest.d11"); 


// 使 用 Windows API 库 函数 GetProcAddress 获 得 动态 库 中 

// DLLLoadedFunction 外 部 函数 符号 

int (*pFunc)(void) = (int(*)(void))GetProcAddress(dllLibHandle, 
"DLLLoadedFunction"); 


// 通过 函数 指针 间接 调用 DLLLoadedFunction 
int a = pFunc(); 
printf("a = %d\n", a); 


getchar(); 


这 里 由 于 用 到 Windows API， 因 此 引入 了 <windows.h> 系 统 库 文 
件 。_declspec (dllimport) 说 明 符 用 于 声明 当前 函数 或 对 象 将 在 加 载 
时 做 动态 连接 ， 这 样 它 所 对 应 的 符号 能 安全 地 在 当前 代码 中 进行 引 
用 o 


在 代码 清单 16-4 中 ， 对 DLLEFunction 函 数 调 用 以 下 的 部 分 驶 是 通过 
Windows API 对 dllTest.dll 的 运行 时 动态 加 载 过 程 了 。GetProcAddress 系 
统 画 数 基于 得 到 的 动态 库 的 句柄 (handle) 来 获 
取 “DLLLoadedFunction” 符 号 所 在 的 相对 地 址 ， 然 后 赋值 给 一 个 相应 类 


型 的 函数 指针 对 象 ， 最 后 通过 该 函数 指针 做 间接 调用 。 


这 里 大 家 要 注意 的 是 ，dll 文 件 的 位 置 要 放 对 ， 如 果 程 序 找 不 到 dll 
文件 则 会 报错 。 此 外 ，dll 文 件 可 以 放 在 与 C 源 文件 的 相同 路 径 下 ， 用 于 
工程 调试 时 进行 加 载 ， 而 在 Debug 目 隶 下 与 可 执行 文件 放 在 一 起 的 dl 文 
件 用 于 在 Debug 目 录 下 直接 运行 可 执行 文件 时 做 dll 文 件 的 加 载 。 


16.2 macOS 系 统 下 创建 静态 库 与 动态 库 


在 macOS 中 ， 我 们 可 以 方便 地 使 用 Xcode 这 一 灵活 强大 的 集成 开发 
环境 来 创建 静态 库 与 动态 库 。Xcode 可 以 在 Mac App Store 免 费 下 载 ， 而 
且 无 需 注 册 开 发 者 账号 即 可 使 用 。 不 过 Apple 开 发 者 账号 申请 起 来 比较 
容易 ， 而 且 也 是 免费 的 ， 直 接 去 http:/developerapple.com 即 可 。 这 里 用 
的 Xcode 版 本 是 8.2.1， 不 过 对 于 创建 静态 库 与 动态 库 而 言 ， 更 老 、 更 新 
的 版 本 都 差不多 一 样 。 


在 macOS 系 统 下 ， 静 态 库 的 创建 和 使 用 与 Windows 环 境 下 的 差 不 
多 ， 并 且 在 使 用 时 也 是 需要 加 入 主 工程 一 同 进行 连接 的 。 而 动态 库 的 
使 用 则 与 Windows 平 台 的 不 太一 样 ， 在 macOS 以 及 其 他 类 Unix 系 统 中 ， 
主 应 用 程序 可 以 直接 在 加 载 时 由 加 载 器 去 动态 加 载 动态 连接 库 中 的 函 
数 与 对 象 ， 但 是 需要 指明 动态 连接 库 的 路 径 ， 在 macOS 中 使 用 
DYLD_LIBRARY_PATH 环 境 变 量 去 指定 。 否 则 的 话 ， 加 载 右 会 默认 
找 /usrvlocalMlib/ 路 径 下 的 动态 库 。 动 态 连接 库 中 所 有 具有 外 部 连接 的 全 
局 函数 与 对 象 的 符号 默认 都 是 可 被 动态 连接 的 ， 因 此 不 需要 像 Windows 
里 那样 使 用 _declspec (dllexport) 去 指定 。 如 果 我 们 希望 在 动态 库 中 
的 某 些 符号 不 允许 被 外 部 连接 或 动态 加 载 ， 可 以 使 用 17.14.1 广 中 所 摘 
可 见 性 属性 来 指明 当前 符号 的 对 外 可 见 性 。 


述 的 第 17 条 


16.2.1 _ macOS 系 统 下 创建 并 使 用 静态 库 


首先 ， 我 们 打开 Xcode， 然 后 选择 左 侧 的 “Create a New Xcode 
Project”， 出 现 选 择 新 项 目的 模板 对 话 框 。 我 们 在 此 对 话 框 中 ， 在 对 话 
框 上 侧 选 择 “macOS” 一 栏 下 的 “Framework&Library” 选 项 区 域 ， 然 后 点 
击 下 面 大 框 里 的 “Library” 图 标 ， 如 图 16-6 所 示 。 
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图 16-6 ”macOSs 库 项 目 创 建 


然后 ， 我 们 点 击 “Next”* 按 钮 到 下 一 步 ， 来 到 项 目 选 项 对 话 框 。 这 里 
可 以 填 上 自己 的 项 目 名 ， 本 demo 用 的 是 “StaticLibTest”*"， 下 面 的 组 织 人 


与 组 织 标识 可 以 目 己 随便 填写 ， 然 后 “Framework” 可 以 选择 “None 
(Plain C/C++Library) ”， 由 于 我 们 不 需要 建立 基于 Cocoa Framework 
的 库 ， 所 以 这 里 只 要 选 普通 C 语 言 的 库 即 可 。 下 面 的 “Type” 选 

择 “Static”， 表 示 要 创建 的 是 静态 库 。 这 个 对 话 框 设置 完 后 的 效果 如 图 
16-7 所 示 。 


Product Name: |StaticLibTest 


Organization Name: |GreenGames Studio 


Organization Identifier: |com.greengames 


Bundle Identifier: com.greengames.StaticLibTest 


Framework: | None (Plain C/C++ Library) 


Type: | Static 


图 16-7 macOS 创 建 静态 库 项 目 


完成 之 后 点 击 “Next” 按 钮 ， 来 到 了 工程 存放 路 径 选 择 对 话 框 ， 这 里 
各 位 选择 将 此 静态 库 工 程 存 放 到 哪个 文件 目录 下 。 选 择 完 之 后 点 
击 “Finish” 按 钮 ， 然 后 就 进入 了 静态 库 工 程 的 主 界面 。 这 里 我 们 能 看 到 
红色 的 libStaticLibTesta， 这 个 文件 将 是 我 们 后 面 成 功 构 建 后 生成 的 静 
态 连 接 库 文件 。 


我 们 首先 设置 项 目 工程 的 编译 选项 ， 点 击 中 间 栏 <TARGETS” 下 面 
的 “StaticLibTest”， 然 后 选择 右 侧 栏 的 *Build Settings”， 找 到 *Apple 


LLVM x.y-Language” 这 一 栏 ， 将 *C Language Dialect” 这 一 项 选择 设置 
为 “gnul1”， 如 图 16-8 所 示 。 


口 Resource Tags Build Settings Build Phases Build Rules 


PROJECT basic ED Levels | 十 区 


StaticLibTest 
TARGETS V Apple LLVM 7.1 - Language 
Setting | staticLibTest 
'char' Type ls Unsigned No 
Allow 'asm', "inline', 'typeof’ Yesd 


CodeWarrior/MS-Style Inline Assembly Yes 5 
Compile Sources As According to File Type $ 
Enable Linking With Shared Libraries Yesd 
Enable Trigraphs No 
Generate Floating Point Library Calls No 
Increase Sharing of Precompiled Headers No 
Precompile Prefix Header No 
Prefix Header 

Recognize Built-in Functions Yes 人 
Recognize Pascal Strings Yes 
Short Enumeration Constants No 
Use Standard System Header Directory Searching Yeso 


图 16-8 Xcode 环境 设置 库 工 程 的 编译 选项 


随后 ， 我 们 鼠标 右键 点 击 带 有 蓝 色 图 标的 工程 文 
件 *StaticLibTest"*， 然 后 选择 “New File”， 这 样 能 看 到 一 个 选择 源 文 件 类 
型 的 对 话 框 。 我 们 仍然 在 上 侧 栏 找到 “macOS”， 然 后 点 击 它 下 面 
的 “Source” 选 项 区 域 中 的 “C File”， 如 图 16-9 所 示 。 


然后 点 击 “Next” 按 钮 ， 输入 C 源 文件 名 “lib”， 这 里 “. c* 司 缀 可 和 省 ， 
默认 为 .c 后 级。 最 后 可 以 将 “Also Create a header file” 选 项 给 去 掉 ， 这 里 


我 们 不 需要 创建 一 个 头 文件 ， 然 后 点 击 “*Next" 按 钮 后 ， 直 接点 
击 “Create” 按 钮 就 在 我 们 的 StaticLibTest 项 目 中 新 建 好 了 lib.c 源 文件 了 了。 
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图 16-9 ”Xcode 新 建 C 源 文件 


我 们 对 lib.c 进 行 编辑 ， 直 接 将 代码 清单 16-1 中 的 内 容 复 制 粘贴 进 
去 。 完 成 之 后 ， 点 击 菜单 栏 上 的 “Product"”， 再 选择 “Build”， 然 后 我 们 
就 能 看 到 原本 红色 的 “libStaticLibTest.a” 变 成 黑色 文字 了 。 此 时 ， 我 们 
右键 点 击 此 “libStaticLibTest.a”， 然 后 选择 “Show in Finder”"， 这 样 就 能 
跳 转 到 “libStaticLibTest.a” 文 件 所 在 的 目录 了 。 我 们 复制 该 文件 ， 然 后 
粘贴 到 主 应 用 工程 的 目录 下 即 可 。 


下 面 我 们 用 Xcode 创建 主 应 用 工程 。 打 开 Xcode 后 同样 先 选 
择 “Create a New Xcode Project”， 然 后 在 选择 靳 项 目 模板 的 对 话 杠 中 选 
择 “macOS" 一 览 下 的 “Application” 中 选择 “Command Line Tool”*"， 如 图 


16-10 所 示 。 


然后 点 击 “Next” 按 钮 ， 弹 出 新 建 项 目 选 项 设置 。 这 里 我 们 可 以 将 项 
目 名 设置 为 *Main”， 然 后 “Language” 这 一 栏 选择 *C”， 如 图 16-11 所 示 。 


完成 后 点 击 “Next" 按 钮 ， 出 现 项 目 工程 存放 路 径 的 选择 对 话 框 ， 我 
们 选择 好 之 后 点 击 “Create” 按 钮 就 创建 好 了 主 工程 项 目 。 此 时 ， 在 Main 
文件 夹 下 自动 生成 了 一 个 main.c 的 C 源 文件 。 我 们 鼠标 右键 点 击 main.c 
源 文件 ， 然 后 选择 “Show in Finder”， 跳 转 到 main.c 文 件 所 在 的 目录 。 然 
后 将 刚才 生成 的 "libStaticLibTest.a" 静 态 连接 库 文 件 拖 进 该 文件 夹 。 完 
成 后 ， 鼠 标 右键 点 击 Xcode 项 目 中 的 “Main" 文 件 夹 〈 黄 色 文 件 夹 图 标的 
那个 ) ， 选 择 “Add Files to Main...”， 选 中 "libStaticLibTest.a”， 然 后 点 
击 “Add” 按 钮 。 这 样 就 把 静态 连接 库 加 入 到 Main 项 目 工程 中 了 ， 如 图 


16-12 所 示 。 


Product Name: 


Organization Name: 


Organization Identifier: 


Bundle Identifier: com.greengames.Main 


Language: 


图 16-11 ”用 Xcode 创建 C 项 目 主 工程 


了 加 Main 
vw. |Main 
| libStaticLibTest.a 


main.c 
= 上司 Products 


图 16-12 ”用 Xcode 将 静 仿 连接 库 加 入 到 主 项 目 工程 


我 们 像 静 仿 库 项 目 设 置 那 样 设置 主 项 目 工程 的 编译 选项 ， 将 C 语 言 
标准 选择 为 "gnu11”。 随 后 ， 我 们 将 代码 清单 16-2 中 的 内 容 复制 烙 贴 到 
此 main.c 源 文件 中 。 最 后 ， 我 们 点 击 工具 栏 左 侧 的 墨色 三 角 箭 头 束 可 以 
编译 main.c 然 后 连接 静态 库 文 件 ，Xcode 会 目 动 执 行 生 成 好 的 Main 可 执 
行文 件 ， 将 结 采 输出 在 下 方 的 输出 框 中 。 


在 Windows 系 统 中 ， 静 态 库 文 件 的 后 缀 为 “ib”， 而 在 几乎 所 有 类 
Unix 系 统 中 ， 静 态 库 文件 的 后 缀 全 都 是 “.a”。 


16.2.2 macOS 系 统 下 创建 并 使 用 动 仿 库 


macOS 系 统 下 创建 动态 库 的 过 程 与 创建 静态 库 十 分 类 似 ， 我 们 在 
设置 项 目 选项 的 时 候 ， 仅 仅 将 “Type” 选 择 为 "Dynamic” 即 可 。 这 里 我 们 
创建 一 个 名 为 “DynLibTest”* 的 动态 库 项 目 工 程 ， 如 图 16-13 所 示 。 


Product Name: DynLibTest 


Organization Name: GreenGames Studio 


Organization Identifier: | com.greengames 
Bundle Identifier: com.greengames.DynLibTest 


Framework: None (Plain C/C++ Library) 


Type: | Dynamic 


图 16-13 Xcode 设置 动态 库 项 目 工 程 


我 们 这 里 创建 一 个 名 为 “dylib.c”* 的 源 文件 ， 随 后 基本 参考 代码 清单 
16-3 的 内 容 ， 但 这 里 必须 去 挥 _ declspec (dllexport) 这 一 说 明 符 。 在 
macOS 以 及 其 他 类 Unix 中 ， 动 态 库 中 所 有 具有 外 部 连接 的 函数 与 对 象 


都 于 认可 被 主 应 用 进行 动态 加 载 。 ，dylib.c 的 内 容 如 代码 清单 16-5 
所 示 * 


代码 清单 16-5 ”macOS 环 境 下 的 动态 库 代 码 


#include <stdio.h> 


// 以 下 函数 与 对 象 将 在 主 程序 中 以 加 载 时 或 运行 时 进行 加 载 的 方式 做 动态 连接 


int RuntimeLoadedFunction(void) 


puts("DLL loaded function is called!"); 
return 100; 


} 
int dyn_runtime = 20; 


完成 之 后 ， 我 们 点 击 菜 单 栏 中 的 “Product*， 然 后 点 击 “Build” 即 可 
完成 构建 ， 最 终生 成 ibDynLibTest.dylib” 文 件 。 


我 们 现在 打开 之 前 创建 的 主 应 用 工程 ， 将 之 前 的 静态 库 文件 删 
除 ， 然 后 与 添加 静态 类 库 类 似 的 方式 将 "libDynLibTest.dylib” 文 件 捞 贝 
到 此 目录 下 。 最 后 ， 我 们 编辑 main.c 源 文件 ， 如 代码 清单 16-6 所 示 。 我 
们 先 使 用 加 载 时 连接 的 方式 。 


代码 清单 16-6 ”macOS 在 加 载 程序 时 加 载 动 态 库 符号 的 主 程序 


#include <stdio.h> 
// 声明 动态 库 中 的 RuntimeLoadedFunction 全 局 函数 
extern int RuntimeLoadedFunction(void); 


// 声明 动态 库 中 的 dyn_runtime 全 局 对 象 
extern int dyn_runtime; 


int main(int argc, const char * argv[]) 


printf("Hello, World!\n"); 


// 调用 动态 库 中 定义 的 RuntimeLoadedFunction 全 拓 
int value = RuntimeLoadedFunction(); 
printf("value = %d\n", value); 


加 
加 
洋 


// 调用 动态 库 中 定义 的 dyn_ runtime 全 局 对 象 
printf("dyn_runtime = %d\n", dyn_runtime); 


return 0; 


当 我 们 编辑 好 代码 清单 16-6 中 的 代码 之 后 ， 点 击 工具 栏 中 的 运行 按 
钮 直接 运行 会 出 现 加 载 时 错误 一 一 在 /usr/locallib/ 路 径 中 找 不 到 
libDynLibTest.dylib 文 件 。 此 时 ， 我 们 可 以 打开 控制 台 程 序 ， 然 后 进入 
到 libDynLibTest.dylib 文 件 所 在 的 目录 ， 然 后 使 用 export 
DYLD_LIBRARY_PATH= 来 指定 用 户 目录 下 的 动态 库 路 径 。 随 后 ， 我 
们 进入 可 执行 文件 Main 所 在 的 目录 ， 然 后 直接 运行 。 整 个 过 程 如 图 16- 
14 所 示 。 


localhost:~ zennychen$ cd /Users/zennychen/Desktop/Main/Main/ 

localhost:Main zennychen$ export DYLD_LIBRARY _ PATH=/Users/zennychen/Desktop/Main/Main 

localhost:Main zennychen$ cd /Users/zZénnychen/Library/Developer/Xcode/DerivedData/Main— 
djvwehzvisibujbdqyncbaakgedb/Build/Products/Debug/ 

localhost:Debug zennychen$ ./Main 

Hello, World! 

DLL loaded function is called! 

value = 166 

dyn_runtime = 20 

localhost:Debug zennycheng$ 


图 16-14 ”在 控制 台中 动态 加 载 动态 库 文件 并 执行 Main 程 序 


上 面 描述 的 是 在 控制 台中 使 用 加 载 程序 时 加 载 动 态 库 的 方式 来 运 
行 主 程序 。 下 面 我 们 将 描述 如 何在 Main 程 序 运 行 时 加 载 动态 库 中 的 符 
号 。 这 里 我 们 需要 在 做 一 些 准 备 。 我 们 在 上 面 原 有 的 Main 工 程 的 基础 
上 ， 需 要 把 动态 库 文 件 添加 到 与 Main 可 执行 文件 的 同一 路 径 中 。 我 们 
右 击 Product 里 的 Main， 然 后 选择 “Show in Finder”"， 然 后 系统 会 弹出 当 
前 Main 所 在 的 目录 ， 我 们 将 libDynLibTest.dylib 文 件 复制 到 该 目录 下 。 
然后 在 main.c 源 文件 中 输入 代码 清单 16-7 的 内 容 。 


代码 清单 16-7 macOSs 使 用 运行 时 加 载 动态 库 符号 的 主 程序 


#include <stdio.h> 
#include <string.h> 
#include <stdbool.h> 


// 此 头 文件 包含 了 运行 时 动态 加 载 动态 库 中 外 部 符号 的 API 
#include <dlfcn.h> 


// 此 头 文 件 包含 了 _NSGetExecutablePath 系 统 API 
#include <mach-o/dyld.h> 
int main(void) 


{ 
// 获取 当前 可 执行 程序 所 在 路 径 
char path[512]; 
Uint32_t size = sizeof(path); 
_NSGetExecutablepath(path, &size); 


// 将 当前 路 径 与 动态 库 文 件 名 进行 拼接 ， 得 到 动态 库 的 完整 路 径 
strcat(path, "/libDynLibTest.dylib"); 


// 使 用 dlopen 函 数 加 载 动态 库 ， 返 回 动态 库 文件 句柄 
void *dylibHandle = dlopen(path, RTLD_NOW); 


if(dylibHandle == NULL) 


puts("dylib file not found!"); 


return -1; 
} 
do 
{ 
// 使 用 dlsym 范 数 加 载 外 部 丽 数 符号 
int (*pFunc)(void) = dlsym(dylibHandle, "RuntimeLoadedFunction"); 
if(pFunc == NULL) 
puts("RuntimeLoadedFunction function not found!"); 
break; 
int a = pFunc(); 
printf("a = %d\n", a); 
// 使 用 dlLsym 函 数 加 载 外 部 对 象 符号 
int *p = dlsym(dylibHandle, "dyn_runtime"); 
if(p == NULL) 
{ 
puts("dyn_runtime object not found!"); 
break; 
} 
printf("dyn_runtime = %d\n", *p); 
while(false); 


// 关闭 动态 库 文件 句柄 
dlclose(dylibHandle); 


代码 清单 16-7 中 用 到 了 macOS 中 的 一 些 系 统 API， 其 中 <dlfcn.h> 系 
统 头 文件 是 大 部 分 类 Unix 系 统 都 自 带 的 ， 这 其 中 也 包括 Linux， 所 以 在 
大 部 分 类 Unix 系 统 中 我 们 都 能 使 用 dlopen 画 数 来 打开 并 加 载 指定 的 一 个 
动态 库 文件 ， 然 后 用 dlsym 画 数 加 载 该 动态 库 中 指定 的 某 个 函数 或 对 
象 ; 最 后 用 dlclose 关 闭 动态 库 文件 。 而 这 里 的 <mach-o/dyld.h> 是 macOS 
专用 的 ， 它 包含 的 NSGetExecutablePath 函 数 用 于 获取 当前 可 执行 文件 
所 在 的 目录 路 径 。 这 里 各 位 要 注意 的 是 ， 在 macOS 中 ， 如 果 我 们 指 
定 “./xxx” 路 径 并 不 一 定 是 可 执行 文件 当前 路 径 ， 而 是 当前 用 户 的 home 

目录 路 径 ， 这 一 点 与 Windows 系 统 不 一 样 。 


16.3 Linux 系 统 下 创建 并 使 用 静态 库 与 动态 库 


在 Linux 系 统 下 我 们 往往 直接 使 用 命令 行 来 编译 整个 C 语 言 工程 ， 
包括 打包 成 静态 库 、 动 态 库 、 生 成 可 执行 文件 等 。 当 然 ， 在 Linux 系 统 
下 我 们 也 可 以 使 用 像 Eclipse 等 集成 开发 环境 (IDE) 进行 开发 ， 不 过 
这 里 我 们 将 使 用 命令 行 来 描述 。 在 几乎 所 有 类 Unix 系 统 中 ， 静 态 库 与 
动态 库 都 用 lib 作 为 文件 名 前 缀 。 比 如 ，libdispatch.a 表 示 一 个 dispatch 静 
人 态 库 文件 ;libdispatch.so 表 示 一 个 dispatch 动 态 库 文件 。 后 级 名 .a 就 是 
压缩 包 archive 的 首 字母 ， 后缀 名 .so 是 shared object 的 首 字母 缩写 。 本 书 
下 面 所 描述 的 编译 环境 为 GCC 4.9.0， 运 行 环境 为 CentOS 7.1。 


16.3.1 Linux 系 统 下 创建 并 使 用 前 仿 库 文 件 


我 们 首先 在 Linux 环 境 下 用 编辑 右 输 入 代码 清单 16-1 中 的 内 容 ， 然 
后 将 文件 保存 为 static_lib.c。 我 们 先 用 以 下 命令 生成 与 之 对 应 的 .o 目 标 
I 


gcc -c -std=gnui1 static lib.c 


完成 之 后 就 会 在 当前 目录 下 生成 static_ lib.o 文 件 。 这 里 的 -c 命 令 选 
项 束 是 将 源 文件 编译 为 目标 文件 ， 而 不 做 连接 处 理 。 然 后 我 们 将 此 日 


标 文件 打包 成 静态 库 文件 : 


ar -cr libstatic lib.a Static_ lib.o 


这 样 ， 在 当前 路 径 中 就 会 出 现 libstatic_lib.a 静 态 库 文件 。 这 里 的 命 
令 选 项 中 c 表 示 创 建 静态 库 文 件 ，r 表 示 如 有 果 当 插入 的 模块 名 已 经 在 库 
中 存在 ， 则 蔡 换 同名 的 模块 。 如 采 我 们 要 对 多 个 目标 文件 打包 ， 那 么 
可 以 再 往 后 添加 目标 文件 名 。 然 后 用 编辑 絮 输 入 代码 清单 16-2 中 的 内 
容 ， 再 将 文件 保存 为 main.c， 与 之 前 的 static_lib.o 存 放 在 同一 路 径 下 。 
做 完 之 后 ， 我 们 用 以 下 命令 生成 可 执行 文件 test: 


gcc main.c -std=gnu11 -L,/ -lstatic lib -o test 


完成 之 后 就 会 在 当前 目录 中 生成 test 可 执行 文件 。 我 们 直接 用 ./test 
即 可 运行 test 程 序 。 这 里 工 用 于 指定 静态 库 的 搜索 路 径 ， 后 面 跟 ./ 表 示 
当前 目录 路 径 ，-] 束 是 用 于 连接 静态 库 的 命令 选项 ， 大 家 应 该 注意 到 
了 ，-] 命 令 后 面 没 有 lib 前 绥 名 ， 也 没有 .a 后 组 名 ， 而 直接 跟 静 态 库 模块 
名 。-0 命 令 选 项 用 于 指定 输出 最 终 文件 名 。 


16.3.2 Linux 系统 下 创建 并 使 用 动态 库 


Linux 下 创建 并 使 用 动态 库 的 方式 与 macOS 系 统 下 差不多 。 我 们 用 
编辑 器 输入 代码 清单 16-5 所 述 内 容 ， 将 它 保存 为 dynamic.c 源 文件 。 然 


后 我 们 用 以 下 命令 对 它 进行 编译 ， 生 成 目标 文件 : 


gcc -std=gnui1 -fPIC -c dynamic.c 


这 条 命令 中 ，-fPIC 选 项 是 将 源 文 件 编译 为 位 置 无 天 的 代码 ， 这 对 
于 构成 动态 库 的 目标 文件 而 言 既 能 增强 安全 性 ， 又 能 增强 灵活 性 。 由 
于 macOS 上 的 Xcode 默认 编译 选项 已 经 加 上 了 -fPIC 编译 选项 ， 因 此 我 
们 无 需 手 动 编辑 更 改 。 而 在 Linux 系 统 中 ， 我 们 需要 显 式 指 定 ， 默 认 的 
选项 是 位 置 相 关 的 。“PIC” 也 就 是 “Position Independant Code” 的 缩写 。 


然后 ， 我 们 用 以 下 命令 创建 动态 库 文件 : 


gcc -Shared dynamic.o -0 libdynamic.so 


这 里 的 命令 选项 -shared 就 是 指定 GCC 编 译 絮 工具 链 对 输入 的 目标 
文件 生成 共 序 目标 文件 ， 也 就 古 Linux 下 的 动态 库 文件 。 


Linux 下 使 用 加 载 程序 时 加 载 动态 库 的 方式 与 macOS 类 似 ， 只 不 过 
我 们 需要 使 用 LD_LIBRARY_PATH 环 境 变 量 来 设置 用 户 指定 的 动态 库 
路 径 ， 否 则 加 载 器 默认 使 用 的 是 系统 指定 的 动态 库 路 径 。 我 们 可 以 使 
用 代码 清单 16-6 中 的 代码 来 进行 尝试 ， 这 里 不 再 袭 述 。 


这 里 ， 我 们 将 举 一 个 使 用 程序 运行 时 加 载 动 态 库 的 例子 ， 由 于 运 
行 加载 的 方式 与 macOS 还 稍微 有 些 不 同 。 我 们 把 代码 清单 16-8 的 内 容 


输入 到 main.c 文 件 中 。 


代码 清单 16-8 ”Linux 系 统 下 通过 运行 时 加 载 动态 库 方 式 的 主 程序 


#include <stdio.h> 
#include <string.h> 
#include <stdbool.h> 


// 此 头 文件 包含 了 运行 时 动态 加 载 动态 库 中 外 部 符号 的 API 
#include <dlfcn.h> 


// 此 头 文件 包含 了 readlink 系 统 画 数 ， 用 于 获取 当前 可 执行 文件 的 完整 路 径 


#include <unistd.h> 


int main(void) 


// 获取 当前 可 执行 程序 所 在 路 径 
char path[512] ; 
int size = readlink("/proc/self/exe", path, 512); 

// 这 里 的 path 得 到 的 是 当前 可 执行 文件 的 完整 路 径 ， 因 此 需要 茜 取 出 它 所 在 的 路 径 名 
while(path[- -size] I= '/' && size > 0); 

path[size] = '\0'，; 


// 将 当前 路 径 与 动态 库 文件 名 进行 拼接 ， 得 到 动态 库 的 完整 路 径 
strcat(path, "/libdynamic.so"); 


// 使 用 dlopen 函 数 加 载 动态 库 ， 返 回 动态 库 文件 句柄 
void *dylibHandle = dlopen(path, RTLD_NOW); 
if(dylibHandle == NULL) 


printf("so file not found: %s\n", path); 
return -1; 


// 使 用 dlsym 画 数 加 载 外 部 函数 符号 

int (*pFunc)(void) = dlsym(dylibHandle, "RuntimeLoadedFunction"); 
if(pFunc == NULL) 

{ 


puts("RuntimeLoadedFunction function not found!"); 
break 


int a = pFunc(); 
printf("a = %d\n", a); 


// 使 用 dlsym 画 数 加 载 外 部 对 象 符号 

int *p = dlsym(dylibHandle, "dyn_runtime"); 
if(p == NULL) 

{ 


puts("dyn_runtime object not found!"); 
break; 


} 
printf("dyn_runtime = %d\n", *p); 


} 
while(false),; 


dlclose(dylibHandle); 


由 于 Linux 与 macOS 相 比 ， 在 获取 当前 可 执行 文件 所 在 的 路 径 上 有 
些 区 别 ， 因 此 这 里 重新 贴 一 下 完整 代码 ， 而 在 其 他 方面 则 差不多 。 然 
后 大 家 可 以 用 以 下 命令 来 编译 main.c: 


gcc -Std=gnu11 main.c -0 test -ldl 


这 条 命令 最 终生 成 名 为 test 的 可 执行 文件 。 这 里 ，-ldl 命 令 选 项 用 
于 连接 dl1 库 。dl 库 包含 了 Linux 系 统 下 对 dlopen、dlsym、dlclose 函 数 的 
实现 ， 在 默认 情况 下 dl 库 是 不 被 GCC 编译 器 上 自动 连接 的 ， 因 此 需要 我 
们 显 式 地 添加 进行 连接 。 


16.4 ”本草 小 结 


本 章 为 大 家 初步 讲解 了 静态 库 与 动态 库 的 创建 与 使 用 。 在 实际 工 
程 项 目 中 ， 我 们 往往 会 涉及 创建 静态 库 与 动态 库 的 需求 ， 而 且 库 对 于 
工程 来 说 也 十 对 功能 模块 的 封 波 与 抽象 ， 为 其 他 功能 模块 的 开发 者 屏 
蔽 掉 对 当前 所 用 模块 的 实现 细节 。 此 外 ， 将 一 些 成 熟 的 代码 打包 成 库 
也 能 节省 不 少 编译 构建 的 时 间 ， 因 此 打包 成 库 确 实 非常 有 用 。 


除了 这 些 C 语 言 标准 的 静态 库 与 动态 库 之 外 ， 有 些 系统 平台 还 有 
自己 特定 的 库 ， 比 如 macOS 上 有 framework 库 文件 (实质 上 是 一 个 文件 
夹 ) ， 用 于 更 好 地 实现 功能 模块 化 ， 它 主要 用 于 Objective-C 与 Swift 纺 
程 语言 。 而 像 Java 编 程 语言 也 有 目 己 的 JAR 库 文件 等 等 。 另 外 ， 像 
Java、Python 等 语言 可 以 调用 C 语 言 实现 的 函数 ， 而 主要 手段 吏 是 通过 
动态 库 文件 进行 加 载 ， 然 后 通过 这 些 语言 特定 的 桥接 API 与 C 函 数 进 行 


交互 。 


第 四 访 ”语法 扩展 篇 


表达 式 中 使 用 复合 语句 
语句 块 作用 域 的 跳 转 标签 


: 语法 扩展 篇 
使 用 C++11 标 准 的 属性 操作 符 


对 可 变 参 数 个 数 宏 的 扩展 


三 进 制 整数 字面 量 


第 17 章 GCC 对 C11 标 准 的 语法 扩展 


从 桌面 系统 一 直到 摧 入 式 系 统 ， 现 在 GCC 编 译 器 或 遵循 GNU 语 法 
扩展 规范 的 C 语 言 编译 器 已 经 十 分 普遍 。 在 桌面 系统 端 ， 像 GCC ( 包 
括 使 用 GCC 核心 的 MinGW、Dev-C++ 等 Windows 上 的 编译 器 ) 、Clang 
编译 器 (包括 Visual Studio 中 集成 的 VS-Clang) 等 都 遵循 GNU 语 法 扩 
展 。 当 然 ，Clang 编 译 器 自己 还 有 一 些 扩展 ， 另 外 GCC 有 些 特 性 它 也 没 
有 文 持 ， 下 一 人 革 会 讲 到 这 些 情况 。 在 娩 入 式 系 统 中 ， 像 用 于 交 义 编译 
的 编译 器 ， 如 ARM-GCC、MIPS-GCC 则 用 得 更 是 普遍 了 ;现在 ARM 
官方 最 新 推荐 使 用 的 ARM Compiler 6 则 完全 基于 Clang 编 译 器 。 此 外 ， 
像 Arduino 也 是 基于 AVR-GCC 或 ARM-GCC 等 ， 根 据 采 用 特定 的 处 理 器 
而 定 ， 所 以 我 们 在 Arduino 集 成 开发 环境 中 也 完全 可 以 使 用 GNU 语 法 扩 
展 。 而 像 macOS、iOS 中 所 用 的 Apple LLVM， 以 及 Android 开 发 用 的 
NDK 也 都 采用 基于 Clang 编 译 器 的 编译 工具 链 。 因 此 ， 我 们 当前 在 绝 
大 多 数 场合 均 可 使 用 更 灵活 、 更 强大 的 GNU 语 法 扩展 。 


由 于 GNU 语 法 扩展 种 类 较 多 ， 并 且 有 些 也 是 由 于 老 的 标准 没有 ， 
而 目 己 加 了 之 后 新 的 C 语 言 标准 又 予以 支持 的 ， 所 以 以 下 介绍 的 GNU 
语法 扩展 主要 束 是 C11 标 准 所 不 具备 的 ， 但 又 比较 实用 的 ， 有 些 GCC 
编译 右 文 持 但 Clang 编 译 侣 不 文 持 的 也 会 男 作 说 明 。 


为 了 桔 别 当前 编译 器 是 否 支 持 GNU 语 法 扩展 ， 我 们 可 以 使 用 
各 有 两 条 下 划 线 ) 。 代 码 清单 17-1 给 出 一 个 


的) 
pa 
C 
全 
人 
> 
潜 
于 
了 


人 简单 的 例子 。 
代码 清单 17-1 鉴别 当前 C 编 译 亏 是 否 文 持 GNU 语 法 扩展 


#include <stdio.h> 

#ifdef __GNUC_ _ 

#warning "This is a GNU compatible compiler!" 
#endif 

int main(void) 


return 0; 


如 果 当前 编译 器 支持 GNU 语 法 扩展 ， 那 么 编译 器 在 编译 时 就 会 发 


17.1 在 表达 式 中 使 用 复合 语句 与 声明 


在 标准 C 语 言 中 我 们 知道 ， 在 一 条 表达 式 中 只 能 使 用 表达 式 作 为 
其 子 表 达 式 ， 而 不 能 使 用 语句 ， 更 不 能 使 用 声明 。 声 明 以 及 其 他 语句 
多 条 表达 式 。 但 在 GNU 语 法 扩展 中 则 可 通过 使 用 一 个 
员 括 号 将 一 条 复合 语句 包 住 作为 一 条 表达 式 。 在 这 复合 语句 中 当然 还 
J 声明 等 其 他 语句 。 


其 语法 形式 为 : (复合 语句 ) 


整个 圆 括号 包 误 的 复合 语句 表达 式 的 计算 结 末 钙 由 该 复合 语句 中 
最 后 一 条 语句 的 计算 结 采 所 表示 的 。 代 码 清 单 17-2 展 示 了 这 种 语法 的 
表达 以 及 效果 。 


这 


代码 清单 17-2 ”表达 式 中 使 用 复合 语句 与 声明 


// main.c 源 文件 
#include <stdio.h> 


int main(void) 
int a = 10, b = 20; 
// 我 们 已 经 知道 ，C 语 言 中 用 { } 包 围 的 一 系列 语句 称 为 一 条 复合 语句 。 
// 这 里 我 们 将 ( ) 包 住 的 复合 语句 作为 = 操作 符 的 右 操作 数 ， 
// 因此 该 复合 语句 的 最 后 一 条 表达 式 的 计算 结果 必须 是 一 个 Int 类 型 


({ 
// 我 们 先 声 明 一 个 对 象 x<， 并 对 其 初始 化 
int x=a>b?a+1li:b-1; 


}); 
printf("a = %d, b = %d\n", a, b); 


// 以 下 是 将 复合 语句 表达 式 作 为 for 语 句 中 用 于 初始 化 的 表达 式 的 例子 
for(int i = ({ 

int x=a- b; 

a -= 6; 

x -= 10 * b; 
}); i < a; i++) 


printf("Hello, world: %d\n", i); 


// 复合 语句 表达 种 表达 式 ， 因 此 是 不 能 直接 作为 左 值 的 ， 但 可 以 以 引用 的 方式 出 现 ， 
// 然 尼 作 为 * 2 操作 符 的 操作 数 发 使 用 
*({ 
&a; 
}) = 100; 


printf("a = %d\n", a); 


代码 清单 17-2 给 出 了 三 种 复合 语句 表达 式 的 使 用 场景 。 第 一 个 例 
子 是 将 复合 语句 表达 式 直 接 用 于 赋值 操作 符 的 场景 。 整 条 复合 语句 表 
达 式 的 计算 结果 就 是 最 后 “atb; ”这 条 表达 式 语句 的 值 。 第 二 个 例子 是 
将 复合 语句 表达 式 用 于 for 语 句 中 对 第 一 条 子 语句 中 临时 变量 的 初始 
化 。 第 三 个 例子 则 直接 通过 复合 语句 表达 式 最 终 所 得 到 的 对 象 a 的 地 址 
作为 间接 操作 的 操作 数 进行 访问 。 大 家 在 这 里 束 能 看 到 ， 通 过 在 一 条 

合 语句 两 边 加 上 左右 圆 括号 束 能 使 它 作 为 一 条 表达 式 来 使 用 ， 这 在 
某 些 场合 还 是 比较 方便 有 用 的 。 


17.2 ”声明 语句 块 作用 域 的 跳 转 标 釜 


我 们 在 11.1.2 节 中 已 经 学 习 到 ，C 语 言 中 的 跳 转 标 签 具有 比较 特殊 
的 函数 作用 域 ， 也 就 是 说 跳 转 标签 无 论 在 当前 函数 的 哪个 语句 块 中 都 
可 见 。 而 为 了 对 C 语 言 能 有 更 好 的 内 部 模块 封装 性 ，GNU 语 法 扩展 中 
添加 了 _label 关键 字 (label 前 后 各 有 两 条 下 划 线 ) ， 用 此 关键 字 声 
明 的 标签 仅 在 当前 语句 块 作用 域 可 见 ， 因 而 也 被 称 为 局 部 跳 转 标签 。 
此 外 ， 在 其 他 语句 块 作用 域 中 也 可 声明 同名 的 局 部 跳 转 标 签 ， 既 不 会 
引发 符号 重 定义 的 冲突 ， 而 且 也 能 正常 跳 转 。 代 码 清 单 17-3 展 示 了 局 
部 跳 转 标 签 的 使 用 。 


代码 清单 17-3 ”局 部 跳 转 标签 的 使 用 


#include <stdio.h> 


#define MY_INNER PROCESS(a) { \ 
_ label MY_JUMP, YOUR_ JUMP, FINAL_PROCESS; \ 
\ 


int b=a- 5; 


if(b > 0) 
goto MY_JUMP; 


Se 
goto YOUR_JUMP ， 


a tt 


MY_JUMP : 
printf("b is above zero! b = %d\n", b); \ 
goto FINAL_ PROCESS,; 


i 


YOUR_JUMP : 
printf("b is not above zero! b = %d\n", b); \ 


WR 


FINAL_PROCESS: 
puts("This is a macro!!"); \ 


int main(void) 


int a = 10， 


if(a > 0) 


// 这 里 声明 a > 0 分 支 语 句 声 
_ label] _ MY_JUMP, YOUR_JUMP, FINAL_PROCESS ; 


int b=a- 5; 


if(b > 0) 
goto MY_JUMP; 


else 


goto YOUR_JUMP ， 


MY_JUMP : 


printf("b is above zero! b = %d\n", 


goto FINAL_ PROCESS,; 


YOUR_JUMP : 


风口 


PF 的 


printf("b is not above zero! b = 


FINAL_PROCESS: 
puts("This is a > 0 path~"); 


else 


{ 


// 这 里 也 同样 声明 a <= 0 分 支 语句 块 中 的 


局 部 跳 转 标签 


b); 


%d\n", b); 


ja > 0 分 支 语句 匡 


os 


局 部 跳 转 标签 ， 
FP 的 完全 相同 


_ label MY_JUMP, YOUR_JUMP, FINAL_PROCESS ; 


int b=a+ 5; 


if(b > 0) 
goto MY_JUMP; 


else 


goto YOUR_JUMP,; 


MY_JUMP: 


printf("b is above zero! b = %d\n", 


goto FINAL_ PROCESS,; 


YOUR_JUMP : 


printf("b is not above zero! b = 


FINAL_PROCESS: 
puts("This is a < 0 path!"); 


// 调用 宏 ， 这 里 


MY_INNER_PROCESS 宏 中 也 有 : 


// 而 且 结 构 也 卉 


本 相同 


MY_INNER_PROCESS(a) ; 


a= ({ 


b); 


%d\n", b); 


可 上 壕 


个 语句 匡 


_ label MY_JUMP, YOUR_JUMP, FINAL_PROCESS ; 


int b=a+S5,; 


if(b > 0) 
goto MY_JUMP; 


else 


goto YOUR_JUMP ， 


MY_JUMP : 


相同 的 跳 转 标签 名 ， 


printf("b is above zero! b = %d\n", b); 
goto FINAL_ PROCESS,; 


YOUR_JUMP : 
printf("b is not above zero! b = %d\n", b); 


FINAL_PROCESS : 


}); 
printf("a = %d\n", a); 


代码 清单 17-3 这 个 代码 示例 详细 说 明了 局 部 跳 转 标签 的 使 用 与 实 
际 效 果 。 代 码 清 单 17-3 也 是 分 了 3 个 小 例子 。 第 1 个 例子 用 一 个 if-else 条 
件 分 文 设置 了 两 个 不 同 的 语句 块 ， 在 里 面 声明 了 相同 名 字 的 局 部 跳 转 
分 文 ， 然 后 执行 差不多 功能 的 操作 。 第 2 个 小 例子 是 比较 有 用 的 ， 使 用 
安 来 封装 语句 块 ， 并 且 在 该 语句 块 中 含有 局 部 跳 转 操作 ， 这 样 隋 能 很 
清晰 地 呈现 局 部 跳 转 标签 的 威力 了 : 如 有 果 没 有 局 部 跳 转 标签 ， 那么 宏 
定义 中 的 跳 转 标签 将 十 函数 作用 域 的 ， 倘 铬 这 个 宏 在 某 个 函数 中 被 使 
用 2 次 ， 那 么 束 会 出 现 跳 转 标签 重 定义 的 情况 。 有 了 局 部 跳 转 标签 ， 那 
么 宏 也 能 更 好 地 起 到 封 狠 抽 象 类 似 代码 块 的 作用 。 第 3 个 例子 则 结合 了 
上 一 市 我 们 提 到 的 复合 语句 表达 式 ， 我 们 可 以 看 到 局 部 标签 也 能 在 复 
合 语句 表达 式 中 很 好 地 工作 。 


17.3” 跳 转 标 签 作为 值 


在 标准 C 语 言 中 跳 转 标签 只 能 用 于 goto 语 句 ， 而 无 法 单独 作为 一 个 
表达 式 所 使 用 。 而 在 GNU 语 法 扩展 中 ， 我 们 能 够 通过 && 单 目 操 作 符 
取 跳 转 标 签 的 地 址 。 这 里 的 && 不 是 逻辑 与 ， 而 是 用 于 取 跳 转 标 签 的 
地 址 的 前 弘 操 作 符 ， 要 跳 转 标签 的 地 址 可 用 于 跳 转 到 它 所 指定 的 代码 
处 。 正 是 因为 它 的 计算 结 末 是 代码 指令 的 地 址 ， 所 以 不 具有 任何 具体 
类 型 ， 在 GNU 语 法 扩展 中 只 能 用 void* 类 型 表示 && 单 目 表 达 式 的 类 
型 。 


此 外 ，goto 语 句 的 表达 也 相应 做 了 扩展 ， 除 了 可 直接 跟 跳 转 标 签 
名 之 外 ， 还 能 跟 指向 标签 地 址 的 指针 做 一 次 间接 引用 后 的 表达 式 。 这 
一 点 非常 有 意思 ， 指 向 跳 转 标签 地 址 的 指针 是 void* 类 型 ， 对 它 做 一 次 
间接 操作 后 ， 表 达 式 的 类 型 就 变 为 void 了 。 因 此 ，goto 后 面 跟 的 是 一 
个 void 表 达 式 ， 这 也 与 标签 的 类 型 相 吻 合 ， 跳 转 标 签 也 不 具备 任何 实 
体 类 型 。 


代码 清单 17-4 展 示 了 跳 转 标 签 作 为 值 使 用 的 方式 。 


代码 清单 17-4” 跳 转 标签 作为 值 使 用 


#include <stdio.h> 
#include <stdlib.h> 


int main(void) 


// 声明 一 个 局 部 跳 转 标签 LOCAL_JUMP 
label LOCAL_JUMP; 


// 声明 一 个 指向 跳 转 标 签 的 指针 
void *p = &&NORMAL_ JUMP; 


// 声明 一 个 指向 跳 转 标 签 的 指针 
void *q = &&LOCAL_JUMP; 


初始 化 为 指向 函数 作用 域 的 NORMAL_JUMP 标 签 地 址 


瑟 


并 初始 化 为 指向 语句 块 作用 域 的 NORMAL_JUMP 标 签 地 址 


二 


int a = 10， 
int *buffer = NULL; 


if(a <= 0 


) 
goto *p; // 跳 转 到 指针 p 所 指向 的 标签 


buffer = malloc(sizeof(*buffer) * a); 
if(buffer == NULL) 本 
goto *p; // 跳 转 到 指针 p 所 指向 的 标签 


for(int i = 0; i < a; i++) 
buffer[i] = i+1; 


if(buffer[0] + buffer[a - 1] < 100) 
goto *q; // 跳 转 到 指针 q 所 指向 的 标签 


printf("The value is: %d\n", buffer[0] + buffer[a - 1]); 


LOCAL_JUMP: 
printf("buffer[a / 2] = %d\n", buffer[a / 2]); 
NORMAL_JUMP : 


if(buffer != NULL) 
free(buffer); 


puts("Program complete!"); 


有 了 可 取 跳 转 标 签 值 的 能 力 ， 使 得 C 语 言 在 跳 转 上 也 有 了 直接 跳 
转 与 间接 跳 转 两 种 方式 ， 这 种 语法 对 称 性 束 与 函数 的 直接 调用 与 通过 
指 回 画 数 的 指针 做 间接 调用 一 样 。 除 了 个 别 较 低级 的 单片机 微 控制 单 
元 (MCU) 不 支持 函数 间接 调用 与 地 址 间接 跳 转 之 外 ， 大 部 分 处 理 器 
都 能 直接 在 指令 上 文 持 这 两 种 跳 转 与 函数 调用 方式 。 尺 管 在 goto 语 句 
本 喘 的 使 用 上 ， 有 不 少 程序 员 秉 持 各 目的 意见 和 看 法 ， 但 从 语法 体系 
结构 来 说 ， 能 文 持 这 种 通过 指针 做 间接 跳 转 的 方式 还 是 很 赞 的 。 


17.4 ”上 租 达 函 数 


我 们 在 第 9 章 介绍 函数 的 时 候 已 经 提 到 过 ，C 语 言 标准 规定 我 们 必 
须 在 文件 作用 域 吓 义 一 个 函数 。 然 而 在 GNU 语 法 扩展 中 ， 我 们 可 以 在 

个 函数 中 定义 一 个 敬 套 函数 (Nested Function) 。 舱 套 函数 不 具有 
任何 连接 ， 如 有 果 要 在 函数 内 声明 某 一 格 套 函数 的 话 ， 可 以 使 用 auto 存 
储 类 说 明 符 ， 表 示 该 函数 无 连接 ， 但 不 能 使 用 extern 或 static 存 储 类 说 
明 符 。 髓 套 函 数 可 被 视 为 共享 其 外 部 函数 的 执行 上 下 文 (包括 栈 空 
间 ) ， 这 样 使 得 骨 套 函数 可 以 访问 其 外 部 函数 所 声明 的 局 部 对 象 。 航 
套 函 数 可 以 通过 函数 指针 的 形式 传递 到 外 部 ， 比 如 外 部 函数 的 返回 类 
型 是 指 疝 一 个 函数 的 指针 ， 然 后 将 其 内 部 所 定义 的 藤 套 函数 返回 出 
去 。 如 采风 套 函数 中 没有 引用 任何 外 部 函数 中 所 声明 的 局 部 对 象 ， 那 
么 当 外 部 函数 返回 之 后 ， 通 过 函数 指针 来 调用 舱 套 玫 数 还 是 安全 的 ; 
倘 大 从 套 函数 引用 了 外 部 函数 所 声明 的 局 部 对 象 ， 那 么 当 外 部 函数 返 
回 之 后 ， 其 执行 上 下 文 由 于 被 回收 ， 所 以 再 通过 函数 指针 来 间接 调用 
其 般 套 函数 ， 可 能 会 引发 运行 时 异 音 ， 或 是 得 到 意 想 不 到 的 运行 结 
果 。 代 码 清单 17-5 列 举 了 赂 套 函 数 的 定义 与 使 用 ， 并 分 析 其 相关 的 执 
人 下 


代码 清单 17-5 ” 髓 公 画 数 的 定义 与 执行 


#include <stdio.h> 
#include <stdint.h> 


pi 

* Test 函 数 用 于 测试 肉 套 函数 的 特性 

* @param p 参数 p 用 于 输出 指向 局 部 对 象 i 的 指针 
* @return 返回 措 向 嵌 套 蜗 数 的 指针 

*/ 

static void (*Test(int **p))(int) 

{ 


int i = 10, a = 100; 


// 分 别 输出 局 部 对 象 i 和 a 的 地 址 


printf("In %s, address of i: QOx%.16tX\n", _ func_ , (uintptr_t)&i); 
printf("In %s, address of a: QOx%.16tX\n", _ func_ , (uintptr_t)&a); 


// 这 里 定义 Test 画 数 中 的 典 套 函 数 InnerTest， 
// 它 具 有 一 个 形 参 arg， 这 里 的 类 型 说 明 符 auto 可 省 
auto void InnerTest(int arg) 


{ 
// 这 里 对 外 部 局 部 对 象 i 的 修改 也 将 会 影响 到 外 部 函数 的 执行 
printf("The value is: %d\n", ++i + arg); 


// 这 里 观察 虚 套 函数 中 外 部 函数 的 局 部 对 象 1 的 地 址 以 及 舱 套 函数 形 参 arg 的 地 址 


printf("In %s, address of i: Ox%.16txX\n", __func_ _ 
(uintptr_t)&i); 
printf("In %s, address of arg: Ox%.16tX\n", __func_, 
(uintptr_t)&arg); 
} 


// 调用 组 套 函 数 Innertest 
InnerTest(a); 


// 我 们 这 里 将 会 发 现 i 的 值 加 了 1 
printf("i = %d\n", i); 


// 如 果 形 参 p 不 空 ， 那 么 将 i 的 地 址 赋值 给 它 
if(p. != NULL) 
“p = &i; 


// 返回 舱 套 函数 的 地 址 
return &InnerTest,; 


= 


} 
static int FetchData(int count) 
{ 


int array[count]， 


for(int i = 0; i < count; i++) 
array[i] =i+1,; 


int sum = 0; 


for(int i = 0; i < count; i += 2) 
sum += array[i]; 


// 在 此 函数 中 再 次 调用 Test 函 数 ， 观 察 运 行 时 的 执行 情况 
// Test(NULL); 


return sum; 


int main(void) 


// 声明 指针 对 象 pTrace， 将 用 于 指向 Test 函 数 
int *pTrace = NULL; 


a 


局 部 对 象 1 的 地 址 


// 声明 函数 指针 pFunc， 直 接 调 用 Test， 
// 将 返回 的 帜 套 函 数 为 它 初始 化 
void (*pFunc)(int) = Test(&pTrace); 


// 我 们 这 里 通过 打 


int data = 
printf("dat 


FetchData 
a = %d\n" 


// 先 输出 调 


printf("Ori 


// 如 果 FetchData 画 数 中 执行 ] 


pFunc 之 前 ， 


FPF 对 Test 函数 的 调用 来 


或 屏蔽 FetchData 函 数 中 


(100); 
,， data); 


Test 函 数 中 局 


部 对 


观察 执行 状态 


象 i 的 值 


ginal i = %d\n", 


*pTrace); 


对 Test 函 数 的 调 


那么 如 


这 里 


可 能 会 引起 程 


序 月 省 


执行 pFunc 的 调 


pFunc(data); 


// 再 输出 调用 pFunc 后 ， 
printf("Original i = %d\n" 


Tes en 中 局 部 对 象 i 的 值 


*pTrace); 


代码 清单 17-5 中 ， 在 Test 中 所 定义 的 内 套 函 数 InnerTest 引 用 了 该 风 
套 函 数 的 外 部 函数 Test 所 声明 的 对 象 ， 然 而 我 们 在 整个 运行 过 程 中 发 
现 执 行 一 切 正 常 。 通 过 打印 Test 函 数 局 部 对 象 i 的 地 址 ， 我 们 发 现 该 对 
象 所 占用 的 栈 空间 始终 被 维护 着 ， 没 有 遭 到 破坏 。 但 是 ， 当 我 们 把 
FetchData 范 数 中 注释 掉 的 Test (NULL) ; 重新 打开 时 ， 再 运行 就 可 能 
会 发 生 异 常 ， 除 非 此 时 把 main 范 数 中 的 pFunc (data) ; 这 条 语句 给 屏 
蔽 掉 。 由 于 在 调用 Test 之 后 ， 其 藤 套 函数 InnerTest 的 执行 上 下 文 发 生 了 
变化 ， 原 有 维护 着 的 局 部 对 象 也 无 法 继续 维护 ， 所 以 再 次 通 
用 藤 套 函数 可 能 引发 异常 。 


过 pFunc 调 


由 于 藤 套 玫 数 的 执行 上 下 文 无 法 使 用 其 他 手段 进行 保护 ， 所 以 它 
无 法 作为 一 个 财 包 传递 到 外 部 环境 使 用 。 此 外 ， 目 前 也 只 有 GCC 才 文 
持 欣 套 函 数 定义 ， 而 LLVM Clang 社 区 也 明确 指出 将 很 有 可 能 永远 不 会 
文 持 帜 套 函 数 这 个 语法 特性 ， 取 而 代 之 的 是 ，Clang 编 译 紫 已 经 实现 了 
更 先进 的 Blocks 语 法 ， 我 们 将 在 第 18 章 做 详细 介绍 。 所 以 ， 笔 者 这 里 


建议 各 位 尽量 避免 将 舱 套 函数 用 在 实际 商业 化 的 项 目 工程 中 ， 一 来 适 
用 范围 不 大 ， 二 来 可 移植 性 也 不 高 。 


17.5 “使 用 typeof 来 获取 对 象 类 型 


GNU 扩 展 语法 特性 中 ， 笔 者 认为 typeof 操 作 符 古 页 献 最 大 的 语法 
特性 之 一 。 通 过 typeof， 我 们 可 以 在 编译 时 获取 到 指定 对 象 的 类 型 ， 
并 且 typeof 表 达 式 可 作为 类 型 用 于 声明 其 他 对 象 。 我 们 可 以 通过 实现 
更 简洁 的 接口 ， 实 现 更 抽象 的 功能 模块 ， 从 而 使 我 们 的 C 语 言 代码 更 
为 精简 ! 


typeof 与 sizeof 、_Alignof 操 作答 具有 相 类 似 的 特性 。 首 和 完 ， 它 们 
一 般 都 是 在 编译 时 进行 计算 ， 而 不 是 在 运行 时 ， 也 不 是 在 预 处 理 阶 
段 ， 其 次 ， 如 采 其 操作 数 是 一 个 可 变 修 改 类 型 或 具有 这 种 类 型 的 表达 
式 ， 那 么 对 这 些 表达 式 的 计算 则 要 放 到 运行 时 。 另 外 ，typeof 还 有 一 
个 强大 特性 是 ， 其 操作 数 可 以 是 一 个 画 数 ， 并 且 当 其 操作 数 是 一 个 函 
数 名 时 ， 整 个 表达 式 束 表示 为 一 个 函数 类 型 ， 而 不 是 指 回 该 画 数 的 指 
针 类 型 。 这 一 点 需要 大 家 注意 。 


我 们 移 通 过 代码 清单 17-6 来 看 看 typeof 操 作 符 的 一 般 使 用 。 
代码 清单 17-6 _ typeof 操作 符 的 一 般 使 用 


#include <stdio.h> 
#include <stdint.h> 


// 定义 函数 Func1 
static void Funci(int a) 


printf("a = %d\n", a); 


} 


// 通过 typeof 来 声明 一 个 函数 Func2， 其 返回 类 型 以 及 参数 列表 都 与 Func1 一 样 
static typeof(Func1) Func2， 


// 定义 函数 Func2 
static void Func2(int b) 


printf("b = %d\n", b); 


// 定义 打印 当前 基本 数值 类 型 的 对 象 的 类 型 的 宏 

#define PRINT_TYPE(expr) _Generic((expr), float:puts("float type"), 
double:puts("double type"), 
default:puts("int type")) 


// 利用 typeof 来 定义 泛 型 的 取 绝 对 值 。 这 里 将 9 强制 转 为 expr 的 类 型 ， 然 后 进行 比较 


bE 


时 


\ 
\ 


#define GENERAL_ABS(expr) ((expr) >= (typeof (expr ) )0? (expr) : -(expr)) 


int main(int argc, const char * argv[]) 


{ 


// 这 里 使 用 typeof(&Func1) 表 示 指 向 Func1 函 数 的 指针 类 型 
typeof(&Func1) pFunc = &Func1l， 
pFunc(100 ) ， 


pFunc = &Func2 ， 
(*pFunc) (200); 


// 我 们 这 里 先 借用 下 一 节 将 会 描 述 的 auto_type 来 萃取 表达 式 的 类 型 ， 


// 这 样 可 以 验证 我 们 之 前 定义 的 宏 没 有 破坏 原 有 的 对 象 类 型 
auto_type i = GENERAL_ABS(-1); 

__auto_ type f = GENERAL_ABS(-1.5f); 
__auto_type d = GENERAL_ABS(-2.25); 


printf("i = %d, f = %f, d = %f\n", i, f, d); 
PRINT_TYPE(i); 
PRINT_TYPE(f); 
PRINT_TYPE(d); 


// typeof 表 达 式 可 以 肉 套 ， 因 为 typeof 的 操作 数 既 可 以 是 一 个 表达 式 ， 也 可 以 是 一 个 类 型 
typeof(typeof(100)) const a = 100; 


// 这 里 用 typeof(a) 表 示 为 一 个 const int 类 型 
typeof(a) array[4] = (typeof(a)[]){1i, 2, 3, 4}; 


// 这 里 jtypeof (array) 表 ne int[4] 类 型 
typeof(array) arr2 = {5, 6, 7, 8}; 


// 这 里 声明 了 一 个 指向 const :int[4] 数 组 的 指针 类 型 ， 即 const int(*)[4] 
typeof(array) *pArray = &array; 


// 这 里 与 上 一 条 语句 一 样 ， 同 样 表示 const int(*)[4] 类 型 
typeof(&arr2) pArray2 = &arr2,; 


int n = 5; 


仆 


// 这 里 声明 了 一 个 变 长 数组 varr， 其 类 型 为 nt[n], n == 5 
// 姑 店 让 最 的 亿 站 为了 6 
int varr[n++]; 


// 这 里 用 varr 声 明了 一 个 变 长 数组 ， 其 类 型 为 jnt[3][n], n == 5 
typeof(varr) varr2[3]; 
printf("varr2 count: %zu\n", sizeof(varr2) / sizeof(varr2[0])) 


站 


printf("size of varr2[0]: %zu\n", sizeof(varr2[0]) / sizeof(varr2[0] [0] ) )， 


// 声明 了 一 个 指向 int[n] (n == 5) 的 变 长 数组 的 指针 对 象 pv， 
// 其 类 型 为 : int(*)[n]， varr2 的 起 始 地 址 为 它 初 始 化 


typeof(varr) *pv = Varr2 


// 这 里 的 空 声明 也 是 合法 的 ， 但 因为 不 产生 任何 副作用 加 
// 所 以 这 里 对 表达 式 pv[++n] 不 进行 计算 ， 所 以 n 的 值 也 没有 变化 
typeof(pvV[++n] ) ， 


// 这 里 用 表达 式 pv[++n] 的 类 到 型 声明 了 一 个 变 长 数组 对 象 Varr3 

// ar3 揭 美 到 籽 int[n] (n == 5) ， 这 里 变量 n 的 值 变 为 了 7 

typeof (pv[++n]) varr3,; 

printf("n = %d\n", n); 

printf("size of varr3: %zu\n", sizeof(varr3) / sizeof(varr3[0])); 


// 这 里 我 们 利用 了 GNU 扩 展 语法 的 取 跳 转 标签 地 址 ， 用 于 表示 const void* 类 型 
typeof((const void* )&&GOTO_LABEL) p = &a; 


if(*(const uint8_t* . < 200) 
goto GOTO_LABEL 


puts("Hello, world!"); 
GOTO_LABEL: 


printf("The value is: %d\n", (*pArray)[0] + pArray2[0][3]); 


代码 清单 17-6 中 我 们 可 以 看 到 typeof 操 作 符 的 强大 威力 。 它 不 仅 可 
对 对 象 与 画 数 进行 操作 ， 而 且 还 能 作用 于 具体 类 型 ， 只 要 是 合法 的 对 
象 、 画 数 以 及 类 型 ， 包 括 跳 转 标 签 的 地 址 ， 这 些 都 能 顺利 地 转换 为 相 
应 的 类 型 ， 并 且 包 含 类 型 限定 符 。 此 外 ， 我 们 还 看 到 了 使 用 typeof 来 
定义 泛 型 取 绝 对 值 操 作 。 由 于 通过 取 宏 参数 表达 式 的 类 型 来 转换 数值 
0， 所 以 我 们 无 需 关 心 每 种 类 型 所 对 应 的 0 的 形态 (比如 单 浮 点 型 的 0 需 
要 表达 为 0.0f， 双 精度 浮 点 型 的 0 需要 表达 为 0.0) ， 这 样 我 们 就 能 十 分 
简单 地 实现 对 任 一 基本 数值 类 型 做 取 绝 对 值 操作 了 。 这 要 比 通过 C11 
标准 所 引入 的 泛 型 选择 表达 式 根据 每 种 特定 类 型 做 特定 函数 调用 的 语 
句 表达 要 简洁 多 了 。 


typeof 的 威力 还 不 仅仅 体现 在 上 述 这 些 基 本 的 使 用 上 ， 我 们 在 第 6 
章 摘 述 结构 体 与 联合 体 的 时 候 提 到 过 ， 如 采 在 结构 体内 或 联合 体内 定 


义 一 个 绒 套 的 命名 结构 体 与 联合 体 ， 那 么 该 和 藤 套 的 结构 体 或 联合 体 仍 
然 与 其 外 部 的 结构 体 或 联合 体 同 处 于 相同 的 作用 域 。 如 末 在 文件 作用 
域 定 义 了 一 个 结构 体 ， 并 且 该 结构 体内 又 定义 了 一 个 肯 套 的 命名 绪 构 
体 ， 那 么 势必 束 影 响 了 该 文件 作用 域 的 名 子 空间 ， 倘 硝 该 结构 体 是 定 
义 在 头 文件 中 ， 并 且 要 被 引入 到 其 他 源 文 件 中 使 用 ， 那 么 所 造成 的 污 
染 会 更 大 。 因 此 我 们 一 般 不 建议 在 结构 体 中 定义 舱 套 命名 结构 体 ， 而 
征 使 用 匿名 藤 套 结构 体 或 联合 体 ， 然 后 直接 用 它 声明 一 个 对 象 作 为 外 
部 结构 体 或 联合 体 的 一 个 成 员 。 在 标准 C11 中 ， 我 们 是 无 法 获取 一 个 
结构 体 或 联合 体 中 舱 套 定义 的 匿名 结构 体 或 联合 体 的 具体 类 型 的 ， 但 
在 GNU 扩 展 语 法 中 ， 这 将 成 为 可 能 ! 代码 清单 17-7 将 为 大 家 展示 这 种 


代码 清单 17-7 通过 typeof 来 获取 结构 体 中 的 匿名 骨 套 结构 体 类 型 


#include <stdio.h> 
struct Frame 
struct 


float x, y; 
}point; 
struct 
float width，height ， 


}size; 
}; 


// 以 下 联合 体 作 为 一 个 名 字 空 间 来 使 用 
union Namesapce 
{ 


struct { int a, b; } classi1; 
struct { float c, d; } class2,; 
struct { double e, f; } class3,; 


// 我 们 通过 定义 方便 获取 一 个 结构 体 或 联合 体 中 的 骨 套 类 型 
#define FETCH TR _SUBTYPE (name, type) typeof((struct name){}.type) 


六 全 


#define FETCH_UNION_SUBTYPE(name， type ) typeof((union name){}.type) 
int main(int argc, const char * argv[]) 


// 我 们 通过 在 typeof 中 构造 一 个 匿名 Frame 结 构 体 对 象 来 获取 其 point 的 类 型 
typeof((struct Frame){}.point) point = { 10.0f, 20.0f }; 


// 我 们 通过 在 typeof 中 使 用 类 型 投射 操作 来 访问 Frame 中 的 成 员 size， 获取 其 类 型 
typeof(((struct Frame*)NULL)->size) size = { 90.0f, 100.0f},; 


struct Frame frame = { point, size }; 


// 我 们 通过 FETCH_UNION_SUBTYPE 宏 来 获取 Namespace 中 class2 的 类 型 
FETCH_UNION_SUBTYPE(Namesapce, class2) object = {frame.point.x, 
frame.size.height}; 


printf("object.c = %f, object.d = %f\n", object.c, object.d); 


代码 清单 17-7 展 示 了 如 何 通 过 typeof 操 作 符 去 获取 结构 体 或 联合 体 
中 模 套 定义 的 匿名 结构 体 或 联合 体 类 型 ， 然 后 跟 普 通 的 结构 体 与 联合 
体 那样 去 声明 对 象 ， 正 党 使用。 我们 可 以 看 到 ， 通 过 这 种 方式 也 能 在 
很 大 程度 上 避免 名 字 空 间 的 污染 ， 尤 其 在 做 一 些 通用 第 三 方 库 的 场合 
会 十 分 有 用 。 


17.6 ”使 用 _auto_type 做 类 型 自动 推导 


从 GCC 4.9 版 本 以 及 Clang 3.8 版 本 起 ， 两 者 均 引 入 了 十 分 现代 化 的 
编程 语言 特性 一 一 类 型 自动 推导 。 类 型 自动 推导 这 一 特性 早先 在 一 些 
具有 动态 特性 的 编程 语言 上 用 得 很 多 ， 比 如 JavaScript、C# 等 ， 后 来 
C++11 标 准 引 入 了 这 一 特性 ， 在 比较 新 的 Swift 编程 语言 上 则 直接 以 类 
型 推导 为 主 进行 代码 编写 。GNU 语 法 扩展 引入 了 __auto_type 关 键 字 
(前 面包 含 两 条 下 划 线 ) 用 于 声明 一 个 对 象 ， 该 对 象 类 型 将 通过 对 它 
初始 化 的 初始 化 器 的 类 型 进行 推导 。 因 此 大 家 要 注意 的 是 ， 如 采 要 通 
过 类 型 推导 来 声明 一 个 对 象 ， 那 么 必须 为 该 对 象 直接 初始 化 ， 否 则 该 
对 象 的 类 型 在 声明 时 是 未 知 的 ， 这 将 导致 编译 错误 。 


通过 类 型 目 动 推导 来 声明 对 象 能 简化 一 些 代码 ， 此 外 对 于 相似 代 
码 的 抽象 也 很 有 帮助 。 代 码 清单 17-8 展 示 了 类 型 自动 推导 的 使 用 方式 
及 其 便利 之 处 。 


代码 清单 17-8 “GNU 语法 扩展 的 类 型 自动 推导 


#include <stdio.h> 


// 为 了 方便 起 见 ， I i _type 定 义 为 obj， 这 样 更 为 简洁 
auto_type 


#define obj 

// 我 们 利用 类 型 推导 来 定义 一 个 交换 两 个 变量 值 的 宏 

#define GENERAL es b) { __auto (和 tmp = (a); \ 
(a) = \ 
tb) = tmp; } 


int main(int argc, const char * argv[]) 


obj a = 10, b = 


GENERAL_SWAP(a，b 


printf("a = %d, 


obj c = 1.5f, d 
GENERAL_SWAP(c， 
printf("c = %f, 


struct MyStruct 
obj s = (struct 
obj t = (struct 
GENERAL_SWAP(S， 
printf("sum of 

ti 和 宇 守 5 


// 这 里 要 注意 的 是 ，__ 
7 而 必须 是 完整 类 型 。 即 用 auto type 声 明 的 对 象 只 能 了 和 和 独 的 标识 符 的 2 


20; 
); 
b = %d\n", a, b); 


= -2.5f; 

d); 

d = %f\n", c, d); 

{ int i; float f; }; 

MyStruct ){1，0， sf}; 

MyStruct){100, -10.25f}; 

t); 

S=%f sum of t = %f\n", s.i + Ss.f, 
f); 


auto_type 不 能 对 一 个 声明 的 对 象 做 部 分 类 型 推导 


Ney 
Ea 


NS 

此 
Ek 2 
im rs 
当 


// 所 以 这 里 我 们 不 


// 初始 化 器 必须 是 一 个 匿名 数组 对 象 


obj arr = (int[ 


能 将 arr 声 明 为 ，0bj a i 3, 4 };, 
TD 人 二 全 局 


]){ 1, 2, 3, 4 }; 


const obj x = ee 
类 


FE 初 始 化 器 的 表达 式 x 的 类 型 限定 符 会 被 忽略 ， 


// 这 里 使 型 推 时 
// 就 跟 普通 的 int y = x; 这 种 声明 方式 一 样 


y 
Dri = %d\n", y); 


// 这 里 声明 的 指针 对 象 p 的 类 型 为 const int * 类 型 


二 对 象 q 是 const int* const 类 型 ， 


arr, 


推导 出 的 英 弄 是 const int* 类 型 ， 


obj qg 来 声 明 就 是 const int* 类 型 。 


q = NULL; // 这 人 句 是 错误 的 
*q = 0) // 这 人 句 也 是 错误 的 


有 又 用 const 去 修 


区 饰 指针 对 象 q， 那 么 q 的 类 型 就 变 为 const int* const 了 


p = NULL; // 这 人 句 没 问题 
printf("*q = %d\n", *q); 


从 代码 清单 17-8 可 以 看 到 ， 我 们 通过 类 型 推导 能 用 更 简洁 的 方式 


来 实现 交换 两 个 任意 数据 类 型 对 象 的 值 ， 这 个 比 typeof 的 表达 方式 还 
更 辣 朋 一 竺 天 抑 


外 ， 我 们 在 代码 清单 17-8 中 将 _auto_type 定 义 为 


这 在 表达 上 也 更 为 洽 略 ， 代 码 看 上 去 也 更 舒服 。 最 后 义 通过 指针 


与 数组 对 象 的 类 型 推导 来 呈现 出 ”auto_type 的 使 用 效果 以 及 约束 。 


17.7 ”对 复数 操作 的 扩展 


6.6 节 谈 到 了 复数 类 型 的 使 用 。 在 C 语 言 中 ， 复 数 类 型 症 一 个 比较 
奇妙 的 数据 类 型 ， 它 像 一 个 结构 体 ， 然 而 我 们 却 可 以 用 比较 目 然 的 方 
式 来 表达 一 个 复数 ， 比 如 3.0+2.0i。 另 外 ， 我 们 访问 一 个 复数 的 实 部 的 
时 候 不 是 通过 访问 其 成 员 属 性 ， 而 是 通过 creal、crealf 或 creall 来 访问 ; 
访问 虚 部 的 时 候 则 需要 通过 cimagf、cimag 或 cimagl 来 访问 。GNU 语 法 
扩展 引入 了 _ real_ 操作 符 (real 前 后 各 有 两 条 下 划 线 ) 用 于 访问 一 个 
复数 的 实数 部 分 ， 使 用 _imag_ 操作 符 (imag 前 后 各 有 了 两 条 下 划 线 ) 
用 于 访问 一 个 复数 的 虚数 部 分 。 这 么 做 的 好 处 是 我 们 无 需 关 心 当前 复 
数 实 部 与 虚 部 的 类 型 ， 可 以 直接 获取 相应 的 值 。 此 外 ，GNU 语 法 扩展 
中 也 引入 了 整数 复数 ， 也 融 是 复数 的 实 部 与 虚 部 都 是 整数 ， 尽 管 整数 
在 复数 操作 过 程 中 起 不 到 什么 作用 ， 但 这 完善 了 整个 复数 类 型 系统 ， 
并 且 再 度 突 显 出 _real_ 与 _imag 操作 符 的 优势 。 


GNU 语 法 扩展 还 引入 了 ~^ 单 目 操作 符 作 用 于 一 个 复数 ， 用 于 计算 
该 复数 的 共 斩 复 数 。 在 C99 标 准 中 ， 我 们 必须 通过 <complex.h> 标 准 头 
文件 中 的 conjf、conj 或 conjl 来 获取 指定 复数 的 共 二 复 数 。 代 码 清单 17- 
9 给 出 了 GNU 语 法 扩展 对 复数 类 型 的 延伸 特性 。 


代码 清单 17-9 GNU 语法 扩展 对 复数 的 延伸 特性 


#include <stdio.h> 
#include <complex.h> 


int main(int argc, const char * argv[]) 


// 这 里 声明 了 一 个 实 部 与 虚 部 都 是 short 类 型 的 复数 对 象 compi， 
// 在 complex 后 面 必须 跟 原 生 基本 类 型 ， 不 能 跟 typedef 类 型 名 

// 因此 这 里 只 能 用 char、short、int 等 ， 不 能 用 int8_t、int32_t 之 类 的 类 型 名 
complex Short compi = 4 - 2i; 


// 对 compi 求 它 的 共 斩 复 数 
compi = ~compi,; 


// 我 们 通过 _real_ 与 ”imag_ 操作 符 来 获取 compi 的 实 部 与 虚 部 
printf("real = %d, imaginary = %d\n", 
_real (compi), __ imag (compi)); 


代码 清单 17-9 以 一 个 简短 的 代码 示例 将 GNU 语 法 扩展 对 复数 的 延 
伸 特 性 都 列举 了 出 来 。 


17.8 ” 半 精 度 浮 点 类 型 


由 于 在 图 像 以 及 音 视频 处 理 领域 ， 数 字 信号 数据 所 需要 的 精度 要 
求 不 高 ， 比 如 像 当前 用 得 较 多 的 图 像 像素 格式 为 RGBA8888， 也 就 是 
一 个 像素 由 4 个 分 量 构成 ， 分 别 表示 红 、 绿 、 蓝 与 透明 度 ， 每 个 分 量 占 
1 个 字 节 大 小 ， 每 个 分 量 的 取 值 范围 一 般 为 从 0 到 255。 在 很 多 专用 处 理 
器 的 处 理 过 程 中 对 这 种 数字 图 像 数 据 用 单 精度 浮 点 显然 会 浪费 带宽 ， 
因此 IEEE754 标 准 协会 在 2008 年 新 发 布 的 标准 中 正式 引入 了 半 精 度 浮 


点 (half-precision binary floating-point) 。 


半 精 度 浮 点 数 的 规格 化 表达 方式 与 单 精度 类 似 ， 它 具有 1 位 符号 
位 ，5 位 指数 位 ， 尾 数 则 有 11 位 ， 其 中 经 指数 偏差 为 15。 


不 过 由 于 当前 CPU 对 半 精 度 的 文 持 十 分 有 限 ， 像 x86 处 理 器 在 引入 
了 AVX/XOP 操 作 时 〈Itel 处 理 器 是 在 SandyBridge 架 构 上 才刚 引入 了 
AVX) 才 引 入 了 对 半 精 度 浮 点 数 数据 存储 格式 的 文 持 ， 而 ARM 处 理 器 
则 更 早 一 些 ， 在 ARMv7 架 构 出 炉 时 则 通过 NEON 技 术 引 入 了 对 半 精 度 
浮 点 数据 存储 格式 的 支持 。 大 家 注意 到 ， 这 些 处 理 器 在 指令 上 仅仅 是 
引入 了 对 半 精 度 浮 点 数据 的 存储 表示 ， 而 没有 提供 任何 算术 计算 操 
作 。 它 们 所 支持 的 仅仅 是 将 半 精 度 浮 点 数 与 单 精度 浮 点 数 之 间 能 相互 
转换 的 特性 ， 如 果 要 对 半 精 度 浮 点 数 做 实际 计算 ， 则 还 需要 软件 库 的 


文 持 。 当 然 ， 目 前 在 处 理 器 上 一 般 不 太 会 对 半 精 度数 据 做 算术 计算 ， 
而 是 将 它们 交 给 GPU 或 其 他 硬件 加 速 器 进行 处 理 。 但 是 ， 像 OpenCL 这 
种 主要 做 数据 密集 型 计算 的 平台 已 经 引入 了 对 半 精 度 浮 点 数 算 术 计 算 
的 文 持 ， 只 要 当前 操作 环境 文 持 。 而 像 Apple 在 2014 年 靳 出 的 Metal 
API 则 直接 对 半 精 度 浮 点 数 加 以 文 持 ， 因 为 能 在 Metal 上 运行 的 GPU 都 
能 文 持 半 精度 浮 点 数 的 算术 运算 。 因 此 GNU 语 法 扩展 引入 了 对 半 精 度 
浮 点 数 的 文 持 也 算 比 较 及 时 。 


在 GNU 语 法 扩展 中 ， 使 用 _ fp16 关 键 字 (前 面 带 有 两 条 下 划 线 ) 
来 声明 一 个 半 精 度 浮 点 数 。 我 们 需要 注意 的 是 ， 在 遵循 GNU 语 法 扩展 
的 C 语 言 中 ， 我 们 只 能 将 一 个 半 精 度 浮 点 数 对 象 用 于 数据 存储 ， 而 不 
能 用 于 计算 ， 除 非 有 第 三 方 库 的 支持 ， 否 则 编译 器 也 是 直接 会 把 该 算 
术 运 算 编译 为 先 将 半 精 度 浮 点 转换 为 单 精度 浮 点 ， 计 算 完 毕 后 再 转 回 
半 精 度 浮 点 。 代 码 清单 17-10 展 示 了 使 用 半 精 度 浮 点 数 的 简单 例子 。 


代码 清单 17-10 ”使 用 半 精 度 浮 点 数 


#include <stdio.h> 
int main(int argc, const char * argv[]) 


float a = 10.5f; 
_fpi6 h = a; 


// 如 果 此 段 代 码 不 经 过 优化 ， 那 么 这 个 printf 画 数 对 实 参 h 做 了 两 次 操作 : 
// 第 一 次 是 将 半 精 度 浮 点 转 为 单 精 度 浮 点 第 二 次 则 是 将 单 精度 浮 点 转 为 双 精 度 浮 点 
printf("The half- floating number is: %f\n", h); 


// 这 里 的 减法 计算 是 先 将 半 精 度 浮 点 数 h 转 换 为 单 精度 浮 点 
// 然后 计算 完 之 后 再 转 回 半 精 度 浮 点 数 

h -= 0.5f; 

printf("h = %f\n", h); 


h = 100000.5f; 


// 


于 100000 .5 已 经 超过 了 


ee Re 所 以 这 生 


printf("The half-floating number is: %f\n", h); 


将 打印 Inf ， 


表示 无 穷 大 


通过 代码 清单 17-10， 我 们 能 看 到 半 精 度 浮 点 数 在 C 语 言 中 使 用 时 
的 特性 了 。 如 果 不 涉 及 到 GPU 或 其 他 计算 加 速 


点 数 。 如 采 我 们 需要 将 数据 传 到 GPU 等 加 速 


用 单 精 度 浮 点 数 进行 计算 处 理 ， 完 成 之 后 再 转 成 半 精 度 浮 点 数 存放 到 


存储 器 之 中 。 


絮 ， 不 要 使 用 半 精 度 浮 
絮 执 行 ， 那 么 我 们 可 以 先 


17.9 “长度 为 堆 的 数组 


在 GNU 语 法 扩展 中 ，C 语 言 能 文 持 声明 长 度 为 0 的 数组 。 这 在 通 肖 
情况 下 意义 不 大 ， 但 是 当 它 作为 一 个 结构 体 最 后 一 个 成 员 时 ， 则 功能 
相当 于 之 前 提 到 的 灵活 数组 作为 结构 体 最 后 一 个 成 员 ， 而 且 比 C99 标 
准 所 引入 的 这 个 语法 特性 更 为 灵活 。 


长 度 为 0 的 数组 对 象 作 为 结构 体 的 成 员 与 C99 标 准 引 入 的 灵活 数组 
对 象 作 为 结构 体 成 员 相 比 ， 在 语法 特性 上 十 分 相似 ， 但 有 以 下 这 些 不 
同 。 


1) 由 于 灵活 数组 对 象 是 不 完整 类 型 ， 所 以 我 们 不 能 用 sizeof 操 作 
符 对 它 进 行 操作 。 而 长 度 为 0 的 数组 可 以 作为 sizeof 操 作 符 的 操作 数 ， 
并 且 整 个 sizeof 表 达 式 的 计算 结 采 为 0。 


2) 灵活 数组 对 象 作为 结构 体 成 员 时 ， 该 结构 体 必须 至 少 舍 有 一 个 
命名 非 空 成 员 对 象 《 即 该 成 员 对 象 用 sizeof 计 算 结果 必须 大 于 0) 。 而 
长 度 为 零 的 数组 作为 结构 体 成 员 时 没有 这 一 要 求 ， 也 融 是 说 长 度 为 堆 
的 数组 对 象 完全 可 以 作为 结构 体 中 唯一 的 成 员 。 


3) 在 C99 标 准 中 ， 带 有 灵活 数组 对 象 作为 成 员 的 结构 体 或 包含 这 
种 结构 体 对 象 的 联合 体 ， 不 能 作为 另 一 个 结构 体 的 成 员 或 一 个 数组 的 


某 个 元 素 。 而 在 GNU 语 法 扩展 中 ， 这 些 都 允许 。 


正 因 如 此 ，GNU 语 法 扩展 也 允许 定义 不 含 任何 成 员 的 结构 体 与 联 
合体 ， 这 样 的 结构 体 与 联合 体 的 大 小 为 0 个 字 方 。 代 码 清单 17-11 展 示 
了 长 度 为 0 的 数组 作为 结构 体 成 员 与 灵活 数组 作为 结构 体 成 员 的 用 法 比 


较 示例 。 


代码 清单 17-11 长度 为 0 的 数组 作为 结构 体 成 员 VS 灵 活 数 组 作为 
结构 体 成 员 


#include <stdio.h> 


// GNU 语 法 扩展 也 允许 定义 一 个 不 含 任何 成 员 的 结构 体 
struct Dummy 


}; 


// 如 果 是 以 灵活 数组 对 象 作为 结构 体 成 员 ， 那 么 该 结构 体 中 至 少 必须 含有 一 个 命名 成 员 对 象 
struct FlexibleArrayStruct 
{ 


int a; // 这 里 命名 成 员 对 象 a 不 能 缺 省 
int flex[]; 
}; 


// ZeroArrayStruct 结 构 体 类 型 的 定义 没有 问题 
struct ZeroArrayStruct 


// 这 里 不 需要 含有 一 个 命名 非 空 成 员 对 象 
int zero[0]; 


了 


int main(int argc, const char * argv[]) 


// GNU 语 法 扩展 允许 直接 声明 一 个 长 度 为 9 的 数组 对 象 


int arr[0]， 


// 长 度 为 零 的 数组 对 象 arr 的 大 小 为 9 


printf("The size is: %zu\n", sizeof(arr)); 


// 不 含 任 何 成 员 对 象 的 Dummy 结 构 体 类 型 的 大 小 也 为 0 


printf("Dummy size is: %zu\n", sizeof(struct Dummy)); 


// zeroArrayStruct 结 构 体 大 小 也 为 9 
printf("ZeroArrayStruct size is: %zu\n", 
sizeof(struct ZeroArrayStruct)); 


struct FlexibleArrayStruct *pFS = NULL; | 


// 以 下 Sizeof(fs .flex) 这 一 表达 式 是 错误 的 ! 因为 pFS->flex 是 个 完整 类 型 ， 
// 它 不 能 作为 Sizeof 操 作 符 的 操作 数 


printf("size = %zu\n", sizeof(pFS->flex)); 


struct ZeroArrayStruct *pZS = NULL; 


// 以 下 的 sizeof(pZS->zero) 表 达 式 是 没 问 题 的 ， 大 小 为 9 
printf("size = %zu\n", sizeof(pZS->zero)); 


// 含有 灵活 数组 成 员 以 及 长 度 为 9 的 数组 成 员 的 结构 体 不 能 直接 用 初始 化 器 进行 初始 化 ， 
// 也 不 能 用 该 结构 体 构造 一 个 匿名 结构 体 对 象 ， 

// 所 以 这 里 先 使 用 匿名 数组 对 象 ， 然 后 再 转 为 指向 结构 体 的 指针 
pFS (Struct FlexibleArraySstruct*)(int[]){4, 0, 1, 2, 3}; 
pZS (Struct ZeroArrayStruct*)(int[]){1i, 2, 3, 4}; 


int sum = 0; 
for(int i = 0; i < pFS->a; i++) 
sum += pFS->flex[i]; 


printf("flex Sum is: %d\n", sum); 

sum = 0; 

for(int i = 0; i < pFS->a; i++) 
Sum += pZS->zero[i]; 


printf("zero Sum is: %d\n", sum); 


17.10 对 可 变 参 数 个 数 的 安 的 语法 扩展 


C99 标 准 引 入 了 可 定义 可 变 参 数 个 数 的 宏 的 语法 特性 ， 但 是 正如 
我 们 在 10.1.5 节 中 所 描述 的 ， 用 于 表示 可 变 实 参 的 标识 符 
_”VA_ARGS 只 能 完全 替换 掉 可 变 实 参 部 分 ， 如 果 可 变 实 参 是 空 ， 那 
么 它 也 就 相当 于 一 个 空白 符 。 这 会 引发 要 定义 类 似 printf 这 种 函数 的 问 
题 。 我 们 在 10.1.5 节 中 提 到 ， 如 果 我 们 要 用 宏 来 定义 printf， 我 们 只 能 
用 #define MY_PRINT (...) printf ( ”VA_ARGS。_) 这 种 形式 。 


而 在 GNU 语 法 扩展 中 ， 引 入 了 逗号 操作 符 与 棒 宏 拼接 符 相 结合 的 
方式 ， 可 让 撩 拼接 符 左 侧 的 逗号 根据 _VA_ARGS_ 所 蔡 换 的 实 参 来 
定 。 如 果 _VA_ARGS_” 所 替换 的 实 参 不 缺 省 ， 那 么 逗号 保留 ， 如 果 为 
缺 省 ， 那 么 逗号 也 会 被 省 去 。 因 此 ， 在 支持 GNU 语 法 扩展 的 情况 下 ， 
我 们 可 以 将 上 述 的 MY_PRINT 定 义 为 : #define MY_PRINT (fmt，…) 
printf (fmt，# 椅 VA_ARGS _ ) 。 这 么 一 来 ， 当 我 们 使 用 MY_PRINT 

(“Hello，worldn”) ; 时 就 不 会 出 现 编译 错误 了 ， 因 为 此 时 可 变 实 参 
列表 为 空 ， 那 么 在 替换 。_VA_ARGS_ 的 时 候 由 于 它 用 棒 拼 接 符 与 前 面 
的 逗号 拼接 ， 形 成 <， 才 ?的 形式 ， 所 以 前 面 的 逗号 也 会 被 省 去 ， 这 样 
就 不 会 出 现 printf (“Hello，worldn”，) 这 种 宏 替换 了 。 


此 外 ，GNU 语 法 扩展 中 还 能 直接 用 #define MY_PRINT (fmt， 
args...) printf (fmt， 需 args) 这 种 宏 定义 形式 。 这 里 ，args 后 面 紧 跟 .… 
表示 该 参数 是 可 变 个 数 的 参数 列表 ， 这 样 在 其 替换 列表 中 可 以 直接 用 
args 来 表示 可 变 个 数 的 实 参 。 命 名 的 可 变 个 数 参数 显然 更 具 表 达 力 ， 

而 且 也 使 得 代码 更 为 整洁 。 代 码 清单 17-12 展 示 了 可 变 参 数 宏 的 扩展 使 
用 o 


代码 清单 17-12 ”可 变 个 数 实 参 的 宏 的 GNU 扩 展 


#include <stdio.h> 


// 使 用 匿名 可 变 参 数 个 数 的 宏 参 数 
#define MY_PRINT(fmt, args...) printf(fmt, ## args) 


// 使 用 命名 可 变 个 数 的 宏 参 数 
#define MY_LOG(fmt, ...) printf(fmt, ## __VA ARGS_ ) 


// 将 MY_EXPR 作 为 一 个 逗号 表达 式 的 宏 来 使 
#define MY_EXPR(a, args...) (a, ## args) 


int main(int argc, const char * argv[]) 


MY_PRINT("Hello, world!\n"); 
MY_LOG("Hello, world!\n"); 


MY_PRINT("The string is: %s\n", "yes"),; 
MY_LOG("The string is: %s\n", "no"); 


// 相当 于 : int a = (10); 
int a = MY_EXPR(10); 
printf("a = %d\n", a); 


// 相当 于 : a += (0，20); 
a += MY_EXPR(0, 20); 
printf("a = %d\n", a); 


这 个 GNU 语 法 扩展 可 谓 是 对 C99 标 准 的 一 个 补 完 ， 使 得 可 变 参 数 
个 数 的 宏 定义 在 语法 体系 上 更 加 完备 ， 而 且 在 使 用 上 也 不 会 有 什么 漏 
洞 。 


17.11 case 语 人 句 中 使 用 范围 表达 式 


GNU 语 法 扩展 中 引入 了 一 个 十 分 便捷 的 case 语 句 范 围 表 达 式 ， 可 
以 使 得 当前 的 case 条 件 作 用 于 某 个 范围 ， 而 不 仅仅 是 一 个 值 上 。 比 
如 ，case 1...5 就 表示 值 如 果 在 1 一 5 的 范围 内 则 满足 条 件 ， 执 行 该 case 语 


句 中 的 逻辑 。 ， 省 略 号 … 殉 作为 一 个 范围 操作 符 ， 其 左右 两 个 操 
作 数 之 间 必 须 至 少 要 用 一 个 空 日 符 进 行 分 隔 ， 如 采写 成 1..5 这 种 形式 


会 引发 词法 解析 错误 。 范 围 操作 符 的 操作 数 可 以 是 任 一 整数 类 型 ， 
括 字 符 类 型 。 另 外 ， 苑 围 操 作 符 的 左 操 作 数 的 值 应 该 小 于 或 等 于 右 操 
作 数 ， 否 则 该 范围 表达 式 融 会 是 一 个 空 条 件 范围 ， 它 永远 不 成 立 。 代 
码 请 单 17-13 展 示 了 对 case 语 句 范 围 表 达 式 的 使 用 示例 。 


代码 清单 17-13 _ case 语句 范围 表达 式 


#include <stdio.h> 
int main(int argc, const char * argv[]) 


int a = 1; 
const int c = 10; 


switch(a) 
// 这 条 case 语 句 是 合法 的 ， case 1 等 效 
case 1 ... 1: 
printf(" a = %d\n", a); 
break; 


// 这 条 case 语 句 中 的 范围 | 操 F 符 的 左 操作 数 大 于 右 操作 数 ， 
// 因此 它 十 条 件 范围 ， 这 条 case 语 句 下 的 逻辑 永远 不 会 被 执行 
Case 2 .. 

putSs(， Hej1o, world!"); 

break; 


// 使 用 const 修 饰 的 对 象 也 可 作为 范围 操作 符 的 操作 数 
se 


case 8 


puts("Wow!"); 
break; 


defauilt: 
break; 


} 


char ch = 'A'，; 
switch(ch) 
{ 


// 从 'A' 到 ' A 四 
case 'A' ,， 
i letter is: %c\n", ch); 
break; 


// 从 '9' 到 ' SS 轩 
case '0' ,， 
re digit is: %c\n", ch),; 


defauilt: 
break; 


我 们 通过 代码 清单 17-13 可 以 看 到 ，case 范 围 表 达 式 即 可 充当 一 
许 语句 ， 像 case 1...5 就 好 比 if (a>=1&&a<=5) ， 而 从 表达 形式 上 看 则 
更 为 徐 洁 。 当 然 ， 范 围 操 作 符 的 操作 数 必须 是 一 个 编译 时 的 常量 ， 不 


= = 
月 雹 个 变量 。 


17.12 ”投射 到 一 个 联合 体 类 型 


我 们 之 前 已 经 学 到 过 ， 在 C 语 言 标准 中 ， 我 们 不 能 将 菜 个 对 象 较 
换 为 一 个 结构 体 或 联合 体 类 型 ， 我 们 只 能 将 某 个 对 象 的 地 址 转换 为 指 
癌 一 个 结构 体 或 联合 体 类 型 的 指针 。 不 过 在 GNU 语 法 扩展 中 ， 我 们 却 
可 以 将 一 个 对 象 转换 为 一 个 包含 该 对 象 类 型 的 联合 体 类 型 。 该 语法 扩 
展 增 加 了 对 联合 体 类 型 的 投射 操作 ， 其 实 也 在 一 些 场合 滑 化 了 代码 。 
代码 清单 17-14 展 示 了 联合 体 类 型 的 投 喘 操 作 代码 示例 。 


代码 清单 17-14 ”联合 体 类 型 的 投射 操作 


#include <stdio.h> 
#include <math.h> 


struct MyPoint 


float x, y; 
/7 
/** 定义 了 一 个 名 为 UnionTest 的 联合 体 ， 其 中 包含 了 三 个 对 象 成 员 */ 


union UnionTest 


{ 

int a; 

double d; 

struct MyPoint point,; 
}; 


/** 计算 并 打印 出 形 参 t 中 的 点 point 到 原点 之 间 的 距离 */ 
static void OutputDistanceToOrigin(union UnionTest t) 


float distance = sqrtf(t.point.x * t.point.x + 
t.point.y * t.point.y); 
printf("Distance to origin: %f\n", distance); 
int main(int argc, const char * argv[]) 
int a = 1; 


// 这 里 通过 对 联合 体 UnionTest 的 投射 操作 ， 将 整 型 对 象 a 转换 为 UnionTest 联 合体 类 型 


union UnionTest un = (union UnionTest)a; 
printf("value is: %d\n", un.a); 


double d = 5.0; 


// 这 里 通过 对 联合 体 UnionTest 的 投射 操作 ， 将 双 精 度 浮 点 对 象 d 转 换 为 UnionTest 联 合体 


un = (union UnionTest)d; 
printf("value is: %f\n", un.d); 


struct MyPoint mp = { 3.0f, -4.0f }; 


// 这 里 通过 对 联合 体 UnionTest 的 投射 操作 ， 

// ne tt Ce 
un = (union UnionTest)mp; 

printf("x = %f, y = %f\n", un.point.x, un.point.y); 


// 这 里 可 直接 用 联合 体 的 投射 操作 将 mp 结构 体 转换 为 UnionTest 联 合体 类 型 


OutputDistanceToOrigin( (union UnionTest )mp ) ， 


型 


17.13 ”使 用 二 进 制 整数 字面 量 


在 C 语 言 标准 中 ， 我 们 通过 使 用 前 组 0 表示 一 个 八进制 整数 〈 比 
如 : 012 表 示 十 进 制 整数 10) ; 通过 0x 或 0X 前 级 表示 一 个 十 六 进 制 整 
数 或 十 六 进 制 浮 点 数 (比如 : 0x10 表 示 十 进 制 整数 16，0x3.8p0 表 示 十 
进 制 浮 点 数 3.5) 。 而 在 GUN 语法 扩展 中 可 以 通过 0b 或 0B 前 绥 来 表示 
一 个 二 进 制 整数 ， 比 如 : 0b01011010 表 示 十 进 制 整数 90，0B0011 表 示 
十 进 制 整数 3 。 


17.14 使 用 _attribute “指定 函数 、 对 象 与 类 型 的 
属性 


我 们 此 前 在 10.8 方 提 到 过 ， 可 以 用 #pragma 预 编译 指示 符 来 指 述 一 
段 代 码 的 特性 。 而 在 GNU 语 法 扩展 中 ， 我 们 除了 可 以 用 加 ragma 预 编译 
和 示 符 之 外 ， 还 能 使 用 attribute 。”(attribute 前 后 各 有 两 条 下 划 线 ) 说 
明 符 (specifier) 所 指定 的 属性 来 指明 用 它 所 修饰 的 函数 、 对 象 或 类 型 
的 相关 特性 。 当 _ attribute 用 于 修饰 对 象 时 ， 它 束 如 同 C 语 言语 法 体 
系 结构 中 的 类 型 限定 符 (type qualifier) ， 跟 const、volatile、restrict 等 
属 一 类 。 当 __attribute_ 修饰 一 个 函数 时 ， 它 吏 相 当 于 一 个 函数 说 明 符 
(function specifier) ， 跟 inline、_Noreturn 必 同一 类 。 人 倘若 _attribute 
在 函数 定义 中 进行 修 上 所， 那么 该 限定 符 可 以 放 在 函数 声明 的 最 前 面 ， 
也 可 以 放 在 函数 标识 符 前 ;而 如 条 只 是 函数 声明 ， 那 么 该 限定 符 除 了 
上 上述 两 个 位 置 之 外 ， 还 能 放 在 函数 声明 的 末尾 。 当 attribute_ 修饰 一 
个 结构 体 、 联 合体 或 枚 举 类 型 时 ， 该 限定 符 只 能 放 在 类 型 标识 符 之 
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_attribute “说 明 符 的 基本 语法 为 : 


_ attribute _ (( attribute-list ))。 


这 里 要 注意 的 是 ，_ attribute “所 指定 的 属性 列表 必须 前 后 用 双 圆 
括号 包围 ， 属 性 列表 中 如 果 有 多 个 属性 ， 那 么 用 去 号 分 隔 。 当 
__attribute ”要 用 来 修饰 一 组 芳 数 声明 时 ， 可 以 将 它 放 在 第 一 个 范 数 声 
明 的 最 前 面 ， 那 么 后 续 声 明 的 函数 都 会 受到 此 _ attribute “的 修 所 。 代 
码 清单 17-15 展 示 了 __attribute _ 的 基本 使 用 以 及 其 语法 特性 。 


代码 清单 17-15” ”attribute ”的 基本 使 用 及 语法 


#include <stdio.h> 
#include <stdint.h> 
#include <stdalign.h> 


/xx 用 attribute__ 修饰 一 个 命名 结构 体 类 型 */ 
struct _ attribute ((packed)) Test 
int8_t a; 
int b; 


}; 


/** 使 用 _attribute 修饰 一 个 匿名 结构 体 类 型 */ 
struct _ attribute __((packed)) 


int16_t s; 

double d; 
}sstruct,; 
/** 使 用 3 个 属性 来 修饰 同一 个 画 数 ， 分 别 是 4 字 节 对 齐 、 总 是 内 联 、 纯 函数 */ 
static int _ attribute ((aligned(4), always_inline, pure)) 
MyTestFunc(void) 
{ 


return 0b01100100 


// 对 MyFunc 画 数 进行 声明 ， 此 时 attribute 说明 符 可 以 放 在 函数 声明 的 末尾 
extern void MyFunc(int a) _ attribute __((pure)); 


/** 使 用 _attribute 来 修饰 一 个 形 参 对 象 */ 
static void foo(int _ attribute ((aligned(8))) al) 


// 在 GNU 语 法 扩展 中 ，alignof 的 操作 数 可 以 是 一 个 表达 式 ， 而 不 单单 只 是 类 型 名 
printf("The alignment of a is: %zu\n", alignof(a)); 


// 这 里 声明 了 三 个 函数 ， 这 三 个 函数 的 返回 类 型 都 是 int， 都 用 aligned(8) 的 属性 修饰 。 
// 而 weak 属 性 只 作用 于 f1; pure 属 性 只 作用 于 f2; always_inline 属 性 只 作用 于 f3 

_ attribute ((aligned(8))) int 

_ attribute ((weak)) fi(int a, int b), 

_ attribute_((pure)) f2(int a, int b), 

_attribute _((always_inline)) f3(void); 


// 以 下 分 别 对 这 三 个 函数 进行 定义 。 在 定义 时 ，__attribute_ 可 缺 省 
int f1i(int a, int b) 


return ax ar+ bx*b， 


} 

int f2(int a, int b) 
: return a + b; 

} 

int f3(void) 

， return 0123 


int main(int argc, const char * argv[]) 


// 这 里 我 们 将 会 看 到 ，struct Test 类 型 的 大 小 为 5 个 字 节 
printf("size of Test: %zu\n", sizeof(struct Test)); 


// 这 里 我 们 将 会 看 到 ，sStruct 的 大 小 为 10 个 字 节 
printf("size of SStruct: %zu\n", sizeof(sStruct)); 


int a = MyTestFunc(); 
printf("a = %d\n", a); 


foo(100); 
printf("f1 = %d\n", f1(3, 4)); 


printf("f2 = %d\n", f2(3, 4)); 
printf("f3 = %d\n", f3()); 


// 这 里 将 声明 的 指针 对 象 p 用 aligned(16 ) 属 性 来 修饰 ， 
// 同时 ， 指 明 (*p ) 的 属性 为 aligned(4) 

int _ attribute ((aligned(4))) * _ attribute ((aligned(16))) p = &a; 
printf("align of p is: %zu\n", alignof(p)); 

printf("align of *p is: %zu\n", alignof(*p)); 


代码 清单 17-15 比 较 详 细 地 介绍 了 _ attribute “说 明 符 的 使 用 方法 以 
及 其 语法 特性 。 下 面 我 们 将 分 别 介绍 _attribute “可 用 来 修 炳 玫 数 、 
量 以 及 类 型 的 第 用 属性 。 


17.14.1 attribute ”用 于 修饰 函数 的 属性 


以 下 将 列举 音 用 的 函数 属性 ， 这 些 属性 一 般 能 用 于 大 部 分 处 理 大 
环境 ， 并 且 在 GCC 编 译 占 以 及 Clang 编 译 副 上 均 能 文 持 。 


1.aligned (alignment) 


aligned 属 性 修 唉 一 个 函数 时 ， 用 于 指示 该 函数 的 首 地 址 至 少 需要 
alignment 个 字 世 对 齐 。 如 采 我 们 所 指定 的 alignment 字 世 数 小 于 移 认 的 
对 齐 字 玉 数 ， 那 么 以 默认 的 字 世 对 齐 为 准 。 如 采 我 们 使 用 编译 命令 行 
ae ee 
用 aligned 属 性 修 师 某 个 函数 时 ， 该 男 数 将 以 我 们 当前 所 指定 的 字 世 数 
做 对 齐 。 


我 们 这 里 要 注意 的 是 ， 用 aligned 属 性 修饰 一 个 函数 后 ， 该 函数 实 
际 的 字 厄 对 齐 数 仍 然 以 连接 器 的 安排 为 准 ， 因 此 该 属性 也 是 一 个 暗示 
性 的 属性 ， 当 然 在 大 部 分 情况 下 ， 函 数 会 满足 我 们 所 指定 的 最 低 子 六 
个 数 对 齐 的 要 求 ， 如 果 我 们 所 指定 alignment 不 太 大 的 话 。 最 后 要 注意 
的 是 ， 我 们 要 指定 函数 的 字 世 对 齐 要 求 必 须 使 用 _attribute “说 明 符 ， 
而 无 法 使 用 C11 标 准 所 引入 的 _Alignas 说 明 符 ，_Alignas 只 能 用 于 修饰 对 
象 。 机 yaa 


代码 清单 17-16 ”aligned 属 性 修饰 画 数 的 使 用 


#include <stdio.h> 


#include <stdint.h> 
#include <stdalign.h> 


/** 指定 funci 首 地 址 至 少 满足 16 字 节 对 广 使 用 inline 画 数 说 明 符 也 没 问题 * 
static inline void _attribute _ es funci(int a) 


printf("a = %d\n", a); 
printf("%s address: OXx%. 16tx\n", _ func , (uintptr_t)&funci); 


static void _attribute ((aligned(64))) func2(void) 


func1i(100); 


printf("funci alignment: %zu\n", alignof(func1)); 
printf("%s alignment: %zu\n", __func_ , alignof(func2)); 
printf("%s address: %.16tX\n", _ func , (uintptr_t)é&func2); 


int main(int argc, const char * argv[]) 


func2(); 


2.always_inline 


用 此 属性 修饰 一 个 函数 时 ， 指 示 编 译 絮 当前 函数 忌 古 内 联 。 如 来 
编译 天 由 于 某 些 限制 而 无 法 将 指定 的 函数 做 内 联 处 理 ， 那 么 在 编译 时 
号 会 报错 。 用 always_inline 属 性 修饰 的 函数 可 以 通过 一 个 函数 指针 做 间 
接 调 用 ， 编 译 郁 将 根据 编译 优化 选项 以 及 上 下 文 来 判定 此 间接 调用 坪 
人 否 也 能 进行 内 联 处 理 ， 但 如 采 间 接 调 用 内 联 失败 则 不 会 引发 编译 销 
误 。 代 码 清 单 17-15 已 经 侣 有 一 些 对 always_inline 属 性 的 使 用 ， 而 代码 
清单 17-17 则 进一步 展示 了 always_inline 属 性 的 用 法 。 


代码 清单 17-17 always_inline 属 性 的 进一步 使 用 


#include <stdio.h> 


/** 用 always_inline 属 性 修饰 函数 Func */ 
static int _ attribute _((always_inline)) func(void) 


return 100; 


int main(int argc, const char * argv[]) 


// 这 里 对 func 的 函数 调用 会 被 内 联 
int a = func(); 


// 这 里 获取 func 的 地 址 也 完全 没 问 题 
int (*pFunc)(void) = &func; 
printf("func address: QOx%.16zX\n", (size_t)pFunc); 


a += pFunc(); 


printf("a = %d\n", a); 


3.flatten 


用 此 属性 修饰 的 函数 ， 在 该 函数 中 调用 的 每 一 个 函数 都 将 尽 可 能 
地 做 内 联 处理 。 而 用 flatten 属 性 所 修饰 的 那个 函数 是 否 内 联 ， 则 根据 编 
译 器 当前 的 编译 选项 以 及 当前 上 下 文 来 定 。 代 码 清单 17-18 展 示 了 
flatten 的 使 用 与 效果 。 


代码 清单 17-18 ”flatten 属 性 的 使 用 与 效果 


#include <stdio.h> 
static int funci(void) 


return 100; 


static int func2(int a, int b) 


return a*a-b™* b; 


static void func3(int a) 


printf("a^2 = %d\n", a * a); 


/** 使 用 flatten 属 性 修饰 本 数 FLlattenTest */ 
static void attribute ((flatten)) FlattenTest(void) 


{ 
int a = funci1(); 
printf("a = %d\n", a); 
a += func2(5, 4); 
printf("a = %d\n", a); 
func3(a); 

} 


int main(int argc, const char * argv[]) 


FlattenTest(); 


从 代码 清单 17-18 我 们 可 以 在 FlattenTest 函 数 中 设置 断 点 ， 然 后 从 反 
汇编 中 能 看 到 ， 除 了 对 标准 库 函 数 的 printf 调 用 没有 内 联 外 ， 对 funcl 、 
func2、func3 函 数 的 调用 全 都 内 联 了 。 由 于 printf 函 数 属于 库 范 数 ， 在 当 
前 编译 上 下 文中 无 法 获得 其 具体 实现 ， 所 以 对 它 的 调用 无 法 内 联 。 而 
在 FlattenTest 函 数 上 面 所 定义 的 funcl1、func2 和 func3 尽 管 没有 显 式 地 使 
用 inline 或 _attribute  ( (always_inline) ) 去 修饰 ， 但 在 用 flatten 属 性 
修饰 的 FlattenTest 玉 数 中 仍然 做 了 内 联 处 理 。 


4.cdecl/stdcall/fastcall/ms_abi/sysv_abi 


这 些 属性 用 在 x86 处 理 器 系统 平台 上 ， 分 别 表示 所 修饰 的 函数 使 用 
C 男 数 调 用 约定 、 标 准 调用 约定 、 快 速 调用 约定 ， 以 及 使 用 MSVC 的 画 
数 调用 约定 或 使 用 System-V 的 函数 调用 约定 。 当 然 ， 正 如 第 15 章 已 经 
介绍 的 ， 像 cdecl、stdcall 以 及 fastcall 这 三 种 调用 约定 都 只 能 用 于 x86 架 
构 处 理 器 的 32 位 执行 模式 下 。 而 ms_abi 与 sysv_abi 则 一 般 用 于 64 位 执行 
模式 。 正 因 GCC 可 同时 支持 ms_abi 与 sys_abi 这 两 种 调用 约定 ， 所 以 我 
们 在 类 Unix 系 统 环境 下 或 在 Windows 系 统 环境 下 写 C 语 言 程序 都 能 具备 
良好 的 可 移植 性 ， 只 要 我 们 先 定 好 两 者 都 采用 哪 一 种 调用 约定 即 可 。 


5.pure 


用 pure 属 性 修 师 的 函数 用 来 说 明 该 男 数 除 了 返回 值 之 外 没有 其 他 任 
何 效 末 ， 并 且 该 函数 所 返回 的 值 仅仅 依赖 于 函数 的 形 参 以 及 /或 全 局 对 


象 。 用 pure 属 性 所 修饰 的 函数 可 以 用 来 辅助 编译 占 做 消除 公共 子 表达 式 
以 及 帮助 做 循环 优化 ， 使 用 这 种 函数 就 好 比 使 用 算术 操作 符 一 般 。 


用 pure 属 性 所 修饰 的 函数 体内 不 应 该 含有 无 限 循 环 ， 不 应 该 对 
volatile 修 饰 的 全 局 对 象 进行 访问 或 是 对 多 个 线程 所 共享 的 全 局 对 象 进 
行 访问 ， 也 不 应 该 访问 其 他 系统 资源 ， 比 如 对 文件 、 套 接 字 等 进行 操 
作 。 简 而 言 之 ， 对 同一 个 使 用 pure 属 性 修 嗓 的 函数 连续 做 两 次 调用 (如 
果 该 画 数 带 有 参数 ， 那 么 两 次 调用 应 该 用 同样 的 实 参 ) ， 那 么 这 两 次 
调用 所 返回 的 结果 应 该 始终 是 相同 的 。 因 此 ， 用 pure 属 性 所 修饰 的 函数 
也 很 容易 让 编译 器 做 内 联 处 理 。 代 码 清单 17-19 展 示 了 pure 属 性 的 使 
用 o 


代码 清单 17-19 ”pure 属 性 的 使 用 


#include <stdio.h> 


static int s = 10; 


/** 以 下 定义 了 返回 类 型 为 void 的 pure 函 数 */ 
static void _ attribute ((pure)) DummyFunc(void) 


puts("Hello, world!"); 


/** 以 下 定义 的 PureFunc 画 数 可 作为 pure 函 数 */ 
static int _ attribute ((pure)) PureFunc(int a, int b) 


return s+a*a+b™* b; 


六 下 定义 的 NormalFunc 不 能 作为 pure 函 数 ， 
为 函数 内 对 全 局 对 象 进行 了 修改 ， 从 而 使 得 返回 结果 会 因为 不 同 的 全 局 对 象 的 值 而 导致 不 同 


六 


4 
static int NormalFunc(int a, int b) 


s += 10; 
return s+a*a-b™* b; 


int main(int argc, const char * argv[]) 


// 各 位 注意 ，DummyFunc 在 这 里 不 会 被 调 
DummyFunc( ); 


int a = PureFunc(3, 4); 
int b = PureFunc(3, 4); 


// 我 们 可 以 很 自然 地 知道 ， 使 用 相同 的 实 参 连续 调用 两 次 PureFunc， 结 果 都 是 相同 的 
printf("a = %d, b = %d\n", a, b); 


a = NormalFunc(5, 4); 

b = NormalFunc(5, 4); 

// NormalFunc 不 是 一 个 pure 函 数 ， 我 们 即便 用 相同 的 实 参 去 做 两 次 调用 ， 
printf("a = %d, b = %d\n", a, b); 


AS 
bly 


也 是 不 同 的 


代码 清单 17-19 中 ，DummyFunc 是 一 个 pure 函 数 ， 但 返回 类 型 为 
void， 在 main 函 数 中 调用 时 由 于 编译 器 认为 它 对 于 程序 执行 不 会 造成 任 
何 影响 ， 所 以 把 它 直 接 给 消除 了 ， 我 们 在 运行 代码 清单 17-19 时 不 会 看 
到 “Hello，world! ”字符 串 的 输出 。 因 此 大 家 要 注意 的 是 ， 一 般 pure 函 
数 的 返回 类 型 不 应 该 是 一 个 void， 并 且 在 调用 时 应 该 总 是 要 有 个 对 象 去 
接收 其 返回 值 ， 否 则 该 函数 的 调用 束 很 可 能 被 消除 。 男 外 ， 函 数 
NormalFunc 不 是 一 个 pure 函 数 ， 尽 管 我 们 使 用 _attribute 

( (pure) ) 对 它 进 行 修饰 也 不 会 有 编译 报错 的 情况 ， 但 一 旦 编译 右 在 
某 些 情况 下 把 此 函数 误 做 优化 (比如 直接 将 它 所 访问 的 静态 对 象 s 的 访 
问 操 作 优 化 为 直接 存放 在 某 个 寄存 全 中， 而 使 得 其 他 线程 对 此 修改 操 
作 不 可 见 ) ， 那 么 执行 效果 与 我 们 的 预期 将 是 不 符 的 。 


6.const 


用 const 属 性 修饰 的 函数 与 用 pure 属 性 修饰 的 十 分 类 似 ， 不 过 const 
属性 比 pure 更 严格 ， 它 要 求 函 数 不 能 读 全 局 对 象 。 此 外 ， 用 const 属 性 


修饰 的 画 数 的 参数 不 能 十 一 个 指 计 类 型 ， 而 且 在 用 const 属 性 修饰 的 函 
数 内 往往 不 能 调用 一 个 非 const 属 性 的 范 数 。 


7.constructor/destructor 


constructor 属 性 用 于 指定 一 个 函数 在 程序 进入 main 函 数 之 前 目 动 被 
程序 加 载 右 调用 。 用 destructor 属 性 修饰 的 函数 则 是 在 main 函 数 执行 
束 之 后 ， 或 是 调用 系统 退出 函数 exit 而 退出 当前 应 用 之 后 ， 由 系统 自动 
调用 。 我 们 可 以 指定 多 个 constructor 画 数 以 及 destructor 画 数 ， 它 们 的 调 
用 次 序 可 能 是 随机 的 。 不 过 我 们 可 以 为 它们 指定 优先 级 来 安排 它们 的 
调用 次 序 ， 带 有 优先 级 的 constructor 属 性 为 : constructor (priority) ; 
带 有 优先 级 的 destructor 属 性 为 : destructor (priority) 。 这 里 的 priority 
是 自己 指定 的 一 个 整数 ，priority 值 越 小 ， 那 么 其 优先 级 越 高 。 对 于 
constructor 函 数 来 说 ， 优 移 级 越 高 ， 那 么 就 越 移 被 执行 ， 对 于 destructor 
函数 来 说 ， 优 移 级 越 高 则 越 晚 被 执行 


constructor 对 某 些 需要 做 全 局 初始 化 ， 但 又 无 法 直接 在 文件 作用 域 
通过 指定 常量 的 形式 做 初始 化 的 对 象 进行 初始 化 来 说 非常 有 用 。 代 码 
清单 17-20 展 示 了 constructor 范 数 与 destructor 玉 数 的 用 法 。 


代码 清单 17-20 ”constructor 罚 数 与 destructor 芳 数 的 使 用 


#include <stdio.h> 
#include <string.h> 


static int s = 10; 


static int array[10]; 

static int sum = 0; 

static void _attribute ((constructor(1))) MyInit1(void) 
puts("This is the first constructor!!"); 


// 给 ar ray 静 态 数组 对 象 初始 化 
int tmp[] = {s, Ss +1, s+ 2}; 
memcpy(array, tmp, sizeof (tmp)); 


} 
static void _attribute ((constructor(2))) MyInit2(void) 


puts("This is the second constructor!!"),; 
const int count = sizeof(array) / sizeof(array[0]); 


for(int i = 0; i < count; i++) 
sum += array[i]; 


} 


static void _attribute ((destructor(1))) MyDeinit1(void) 
{ 


puts("This is the second destrctor!!"); 


const int count = sizeof(array) / sizeof(array[0]); 
sum = 0; 


for(int i = 0; i < count; I++) 
sum += array[i]; 


printf("sum = %d\n", sum); 


} 
static void _ attribute ((destructor(2))) MyDeinit2(void) 


puts("This is the first destrctor!!"); 


// 将 array 数 组 对 象 全 都 清 零 


memset(array, 090, sizeof(array)); 


int main(int argc, const char * argv[]) 


printf("sum = %d\n", sum); 


我 们 执行 代码 清单 17-20 中 的 程序 之 后 就 能 很 清楚 地 看 到 两 个 
constructor 范 数 与 两 个 destructor 函 数 的 执行 次 序 了 。 


8.deprecated 


用 这 个 属性 来 修饰 画 数 说 明 该 男 数 已 经 被 废弃 了 ， 如 果 程序 员 在 
目 己 的 函数 中 调用 此 函数 ， 那 么 编译 器 会 报 出 警告 。deprecated 属 性 还 
能 附加 自己 定制 的 消息 ， 形 式 为 : deprecated (message) 。 这 里 的 
message 是 一 个 C 语 言 字 符 串 字面 量 。 代 码 清单 17-21 展 示 了 deprecated 必 
性 的 用 法 


代码 清单 17-21 ” deprecated 属性 的 使 用 


#include <stdio.h> 
static void _attribute ((deprecated)) MyFunc(void) 
puts("This is MyFunc!!"); 
static void 
_attribute __(( 
deprecated("Please use MyNewFunc instead") 


)) MyOldFunc(void) 


puts("This is MyOldFunc!!"); 


static void MyNewFunc(void) 


puts("This is MyNewFunc!"); 


int main(int argc, const char * argv[]) 


// 这 里 编译 器 会 报 出 警告 一 'MyFunc' is deprecated 
MyFunc( ); 


MyOldFunc( ); 


MyNewFunc( ); 


9.dllimport/dllexport 


这 两 个 属性 主要 用 于 Windows 系 统 以 及 塞 班 系统 ， 指 定 具 有 外 部 连 
接 的 函数 可 作为 动态 连接 库 的 符号 进行 导入 或 导出 。__attribute 
( (dllimport) ) 相当 于 在 Windows 系 统 上 的 MSVC 编 译 器 中 的 
declspec (dllimport) ，dllexport 属 性 也 一 样 。 详 细 可 参考 16.1.2 节 内 


顺 | 


10.naked 


这 个 属性 主要 用 于 ARM、x86_64、AVR 等 处 理 器 平台 。 默 认 情况 
下 ， 编 译 逢 会 对 一 个 函数 实现 目 动 生成 某 些 编译 赴 既 定 的 上 下 文保 护 
与 恢复 代码 ， 前 者 称 为 prologue， 后 者 称 为 epilogue。 当 用 了 此 属性 之 
后 ， 函 数 实现 就 不 会 生成 prologue 以 及 epilogue 代 码 。 也 就 是 说 ， 用 此 
属性 修饰 的 函数 对 于 我 们 来 说 束 是 一 个 纯粹 的 函数 入 口 ， 我 们 可 以 在 
里 面 写 内 联 汇编 ， 并 且 即 便 函 数 返 回 类 型 不 是 void， 我 们 也 无 需 自 己 显 
式 添加 return 语 句 ， 直 接 用 汇编 指令 返回 即 可 。 男 外 ， 在 x86_64 环 境 
下 ，naked 函 数 中 只 能 用 内 联 汇 编 ， 而 不 能 使 用 其 他 C 语 言语 句 。 有 了 
naked 函 数 ， 我 们 就 可 以 直接 在 C 源 文件 里 写 汇 编 代码 了 ， 而 且 用 内 联 
汇编 实现 的 C 函 数 还 能 通过 内 联 等 处 理 做 进一步 的 优化 。 代 码 清单 17- 
22 展 示 了 naked 函 数 的 用 法 。 


代码 清单 17-22 naked 函数 的 用 法 


#include <stdio.h> 


/** 定义 一 个 naked 函 数 MyASMFunc， 该 函数 实现 100 + (a - b) 的 功能 */ 
static int _ attribute ((naked)) MyASMFunc(int a, int b) 


int a = 9; // 在 naked 函 数 中 使 用 一 般 的 C 语 言语 句 是 错误 的 ， 
// 这 里 应 该 使 用 纯 内 联 汇编 
asm("sub %esi, %edi"); 
asm("mov $100, %eax"); 
asm("add %edi, %eax"); 


// 最 后 不 需要 return 语 句 ， 直 接 用 RET 指 令 做 函数 返回 即 可 
asm("ret"); 


int main(int argc, const char * argv[]) 


int a = MyASMFunc(10, 20); 
printf("a = %d\n", a); 


各 位 要 注意 的 是 ， 大 家 要 执行 代码 清单 17-22 中 的 程序 时 必须 要 在 
x86_64 环 境 中 ， 因 此 需要 确保 当前 系统 是 64 位 系统 ， 并 且 编译 器 所 用 
的 输出 目标 是 64 位 程序 才能 正常 运行 。 


11.noinline 
此 属性 与 always_inline 相 反 ， 用 于 指明 一 个 函数 不 做 内 联 处 理 。 
12.nonnull 


此 属性 可 用 于 修饰 市 有 指针 类 型 形 参 的 玉 数 ， 指 明 该 男 数 所 有 指 
针 类 型 的 形 参 不 能 为 裤 。 另 外 ， 我 们 也 可 以 使 用 nonnull (arg- 
index，.…) 的 形式 来 指定 哪些 指针 对 象 的 参数 不 能 为 空 。 其 中 ，arg- 
index 的 最 小 值 为 L， 所 以 计数 从 1 开始 ， 而 不 是 从 0 开始 。nonnull 这 个 属 
性 用 来 做 低层 的 库 或 中 间 件 非常 有 用 ， 这 样 一 来 可 以 告诉 上 层 应 用 开 
发 人 员 哪 些 参数 是 不 能 为 至 的 ， 二 来 还 能 防止 上 层 应 用 开发 人 员 误 将 


不 该 为 空 的 参数 传 空 进去 ， 否 则 会 以 编译 器 
码 清单 17-23 给 出 了 nonnull 属 性 的 使 用 方式 。 


A 十 


代码 清单 17-23 nonnull 属性 的 使 用 


#include <stdio.h> 


/** 定义 一 个 函数 MyFunc， 指 明 该 函数 的 所 有 指针 类 型 的 
static int _attribute _((nonnull)) MyFunc(int *p) 


// 这 里 对 形 参 p 做 是 否 为 空 的 判断 会 引发 编译 器 警告 ， 
// 因为 该 参数 已 经 被 断言 不 能 为 空 】 
if(p == NULL) 

return 0; 


return *p + 10; 


} 


/** 这 里 定义 函数 MyFunc2， 
static void attribute _ 


指明 其 第 一 个 形 参 p 不 能 为 空 


上 


p 是 否 为 空 的 判定 会 引发 编译 器 警告 
L 


// 这 里 对 形 参 
if(p == NULL) 
return; 
// 这 里 对 形 参 q 是 否 为 空 的 判定 不 会 引发 编译 器 警告 
if(q == NULL) 
大 二 0; 
else 
*p=*q+1; 


} 


区 参 都 不 为 空 


洁 的 方式 呈现 出 来 。 代 


A 


(( nonnull(1) )) ee *p, int *q) 


/xx 这 里 定义 了 函数 MyFunc3， 
static void _attribute (( nonnull(2, 4) )) 
MyFunc3(int a, int *p, int b, int *q) 


} 


int main(int argc, const char * argv[]) 
int a = 10; 

a = MyFunc(&a); 

printf("a = %d\n", a); 


// 这 里 如 果 传 空 来 调用 MyFunc 郴 数 ， 那 么 编译 器 会 发 出 警告 
int b = MyFunc(NULL ) ， 
printf("b = %d\n", b); 


MyFunc2(&b, &a); 


printf("b = %d\n", b); 


// 这 里 对 第 一 个 参数 传 空 会 引发 编译 器 
MyFunc2(NULL, &a); 
不 会 引发 编译 器 警告 


// 这 里 对 第 二 不 参数 传 空 
printf("a = %d\n", a); 


隘 
了 


MyFunc2(&a, NULL); 


上 明了 第 二 个 参数 与 第 四 个 参数 不 能 大 


空 */ 


MyFunc3(a, &a, b, &b); 


13.returns_nonnull 


该 属性 用 于 指明 它 所 修饰 的 的 返回 值 不 会 是 一 个 空 指针 。 
returns_nonnull 属 性 只 能 用 于 修饰 返回 类 型 为 一 个 指针 类 型 的 函数 。 它 
的 作用 与 nonnull 属 性 类 似 ， 一般 用 于 告诉 上 层 应 用 开发 人 员 ， 当 前 函 
数 的 返回 值 不 会 为 宝 ， 因 此 不 需要 在 自己 函数 内 再 去 判定 调用 此 属性 
修业 的 函数 之 后 的 指针 对 象 是 否 为 至 ， 从 而 使 代码 更 为 衍 洁 。 代 码 清 
单 17-24 展 示 了 returns_nonnull 属 性 的 使 用 示例 。 


代码 清单 17-24 ”returns_nonnull 属 性 的 使 用 


#include <stdio.h> 
static int s = 10; 


/** 定义 一 个 函数 MyFunc， 指 明 该 函数 的 返回 值 不 为 空 “/ 


static int* _ attribute ((returns_nonnull)) MyFunc(int *p) 


if(p == NULL) 
return &s; 


return p; 


int main(int argc, const char * argv[]) 
int a = 1; 
const int *p = MyFunc(&a); 
printf("*p = %d\n", *p); 


p = MyFunc(NULL); 
printf("*p = %d\n", *p); 


14.hot/cold: hot 


该 属性 用 来 各 知 编译 吉 ， 当 前 函数 属于 调用 比较 频 娄 的 或 是 占用 
系统 资源 比较 高 的 ， 属 于 性 能 热点 (hot spot) ， 编 译 器 可 以 对 此 函数 
做 深度 优化 。 而 cold 属 性 则 相反 ， 它 用 于 告诉 编译 器 ， 当 前 函数 很 少 执 
行 ， 对 运行 性 能 影响 微乎其微 ， 编 译 器 可 将 它 安排 到 远离 热点 函数 的 
子 代码 段 中 。 编 译 器 将 所 有 热点 函数 安排 到 一 个 段 ， 将 所 有 冷 点 代码 
安排 到 一 个 段 对 于 运行 时 性 能 的 影响 还 是 不 小 的 。 尤 其 是 当 我 们 做 高 
性 能 计算 的 时 候 ， 有 时 发 现 目 己 优化 了 一 个 函数 后 整体 性 能 反而 低 了 
一 点 ， 这 很 可 能 说 明 你 的 代码 改动 对 整个 程序 的 代码 结构 安排 造成 了 
影响 ， 使 得 代码 执行 时 对 指令 Cache 造 成 了 不 良 影响 。 下 面 我 们 将 讨论 


代码 段 这 个 话题 。 


15.section: section 


该 属性 的 用 法 是 : section (“section-name”) 。 在 基于 GCC/Clang 编 
译 器 的 编译 工具 链 中 ， 会 将 编译 好 的 代码 放 入 text 段 。 然 而 ， 就 如 我 们 
上 面 第 14 条 中 所 提 及 的 ， 将 代码 完全 交 给 连接 器 安排 可 能 会 导致 几 个 
调用 挨 得 比较 近 的 函数 被 安排 在 相互 离 得 较 远 的 地 址 位 置 ， 或 者 几 个 
函数 之 间 有 调用 关系 的 代码 可 能 被 隅 得 较 远 ， 这 会 导致 这 些 代码 在 执 
行 时 造成 指令 Cache 命 中 率 低下 ， 从 而 影响 整体 程序 执行 性 能 。 为 了 避 
免 因 指令 Cache 的 命中 率 过 低 而 造成 程序 性 能 的 影响 ， 我 们 可 以 将 这 些 
调用 挨 得 比较 近 的 函数 ， 或 者 彼此 之 间 有 调用 关系 的 画 数 安排 到 同一 
个 段 中 。 比 如 像 : 


void funcA(void) 


funcB( ); 
funcc(); 
funcD(); 


在 funcA 玉 数 中 依次 调用 了 funcB、funcC 和 funcD， 那 么 我 们 可 以 将 
这 4 个 函数 安排 在 同一 个 代码 段 中 ， 或 者 将 funcB、funcC、funcD 安 排 
在 同一 个 代码 段 中 。 男 外 还 有 像 : 
void funcA(void) 
funcB( ); 


void funcB(void) 


funccC(); 


void funcC(void) 


funcD(); 


像 这 种 有 彼此 调用 关系 的 函数 可 以 看 情况 安排 在 同一 个 代码 段 。 
这 里 的 调用 关系 为 : funcA 一 funcB 一 funcC 一 funcD。 尤 其 在 同一 个 循环 
里 所 执行 的 一 些 函 数 放 在 同一 个 段 中 往往 会 有 比较 好 的 性 能 表现 。 


不 同 的 处 理 器 以 及 不 同 的 操作 系统 ， 对 于 子 段 的 定义 方式 可 能 不 
同 ， 代 码 清单 17-25 展 示 的 是 具有 mach-o 目 标 格式 的 macOS 系 统 下 的 子 
段 指 定 方式 。 


代码 清单 17-25 ”macOS 下 对 section 属 性 的 指定 


#include <stdio.h> 


static void _ attribute (( section("_ _TEXT,MySection") )) MyFunci(void) 


puts("This is MyFunc1!"); 


static void _attribute (( section("_ _TEXT,MySection") )) MyFunc2(void) 


puts("This is MyFunc2!"); 


static void Test(void) 


printf("MyFunc1 address: Ox%.16zX\n", (size_t)&MyFunci1); 
printf("MyFunc2 address: Ox%.16zX\n", (size_t)&MyFunc2); 
printf("Test address: %.16zX\n", (size t)&Test); 


} 
int main(int argc, const char * argv[]) 
{ 
MyFunc1(); 
MyFunc2(); 
Test(); 
printf("main address: %.16zX\n", (size_t)é&main); 
} 


在 代码 清单 17-25 中 ， 我 们 发 现 对 子 段 section 的 指定 必须 先 包 合 一 
个 段 segment。 这 个 段 我 们 可 以 通过 对 当前 main.c 进 行 反 汇编 得 到 。 用 
Xcode 的 反 汇 编 见 图 17-1。 
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图 17-1 利用 Xcode 查询 当前 文件 的 反 汇 编 


首先 在 当前 源 文件 的 编辑 状态 下 ， 在 菜单 栏 选择 “Product”*"， 然 后 
选中 “Perform Action”， 再 选择 “Assemble‘main.c'” 即 可 ， 然 后 就 会 跳 转 
到 main.c 源 文件 的 汇编 代码 界面 。 在 汇编 代码 界面 中 ， 我 们 看 到 了 第 一 
行 就 是 ，.section TEXT，__text，regular，pure_instructions。 我 们 就 


用 _TEXT 作 为 Segment 名 即 可 。 


如 采 在 Linux 环 境 下 ， 我 们 可 以 通过 -S 命 令 选项 来 输出 当前 C 源 文 
件 对 应 的 汇编 文件 。 


代码 清单 17-25 中 ， 我 们 定义 了 名 为 MySection 的 子 段 。 通 过 输出 ， 
我 们 发 现 MyFunc1 与 MyFunc2 的 地 址 非常 接近 ， 而 没有 指定 子 段 的 Test 
与 main 函 数 的 地 址 则 非常 接近 。 在 笔者 测试 环境 下 ，myFEuncl 的 地 址 为 
0x100004BF0; myEFunc2 的 地 址 为 : 0x100004C10。Test 函 数 的 地 址 为 : 
0x1000008D0; main 函 数 的 地 址 为 : 0x100000890 。 


16.used/unused 


unused 属 性 修 上 所 一 意味 着 该 画 数 很 可 能 不 会 在 整个 程序 中 调 
用 。 现 在 的 GCC 以 及 Clang 编 译 絮 对 于 不 会 税 调 用 到 的 范 数 可 能 会 发 出 
编译 瑚 警告 ， 如 采 我 们 对 该 函数 指明 了 unused 属 性 ， 那 么 编译 右 则 不 会 
再 报 出 警告 。 而 used 属 性 则 意味 着 该 函数 的 代码 必须 在 连接 时 生成 ， 

能 被 优化 摊 ， 无 论 该 画 数 是 否 被 其 他 函 数 调用 。 


17.visibility: visibility 


该 属性 用 于 指示 连接 器 当前 函数 符号 对 外 部 模块 的 可 见 性 ， 一 般 
用 于 动态 连接 库 的 制作 。visibility 属 性 的 声明 形式 为 visibility 
(“visibility-type”) ， 这 里 visibility-type 有 4 个 取 值 ， 分 别 为 default、 


hidden 、protected 以 及 internal 。 


@default 可 见 性 十 上 默认 的 从 号 连接 可 见 性 ， 如 来 我 们 不 指定 
visibility 属 性 ， 那 么 默认 束 使 用 此 默认 的 可 见 性 。 默 认可 见 性 的 对 象 与 
函数 可 以 直接 在 其 他 模块 中 引用 ， 包 括 在 动态 连接 库 中 ， 它 属于 一 个 
正常 、 完 整 的 外 部 连接 。 


@hidden 可 见 性 指明 了 它 所 修 唉 的 对 象 和 函数 具有 “隐藏 连接 ”。 在 
同一 共享 目标 文件 〈.so 文 件 ) 中 ， 有 具有 隐藏 连接 的 一 个 对 象 或 函数 的 
多 个 声明 都 将 引用 同一 对 象 或 函数 。 


Ginternal 可 见 性 与 hidden 可 见 性 类 似 ， 不 过 它 明 确 指示 连接 历 ， 当 
前 所 修饰 的 对 象 或 函数 不 能 在 其 他 模块 中 引用 。 不 过 根据 不 同 的 目标 
文件 格式 ， 对 连接 属性 的 定义 可 能 会 有 些 差异 ， 比 如 在 macOS 中 的 
mach-O 格 式 的 目标 文件 而 言 ，hidden 可 见 性 同样 也 无 法 被 外 部 模块 所 
Be 


@protected 可 见 性 与 default 可 见 性 相 类 似 ， 不 过 该 可 见 性 指明 了 用 
它 所 修饰 的 对 象 或 函数 与 当前 模块 所 绑 定 ， 这 意味 着 该 对 象 或 函数 不 
能 被 另 一 模块 所 履 盖 重 写 。 


下 面 ， 我 们 将 通过 代码 清单 17-26 与 代码 清单 17-27 来 观察 default 可 
见 性 、hidden 可 见 性 以 及 internal 可 见 性 在 macOS 系 统 上 的 效果 。 各 位 也 
可 以 根据 第 16 章 所 描述 的 内 容 在 Linux 系 统 上 进行 尝试 。 


代码 清单 17-26 macOS 中 对 可 见 性 属性 的 测试 (动态 库 的 代码 ) 


// 1ib2.c 
/** 定义 hidden 可 见 性 的 函数 MyHiddenTest */ 
int attribute ((visibility("hidden"))) MyHiddenTest(void) 


return 100; 


/** 定义 jnternal 可 见 性 的 函数 jnternal */ 
int _ attribute ((visibility("internal"))) MyInternalTest(void) 


return 200; 


// lib.c 
#include <stdio.h> 


// 这 里 对 MYHiddenTest 与 MyInternalTest 画 数 的 明 不 需要 显 式 地 添加 可 见 性 属性 
// 它们 引用 之 前 声明 过 的 相应 函数 
extern int MyHiddenTest(void); 


extern int MyInternalTest(void); 


/xx* 这 里 定义 默认 可 见 性 的 函数 MyExtDynFunc */ 
void MyExtDynFunc (void) 


puts("This is my so test!"),; 


printf("hidden value: %d\n", MyHiddenTest()); 
printf("internal value: %d\n", MyInternalTest()); 


代码 清单 17-26 展 示 了 两 个 源 文件 ， 一 个 是 lib2.c， 另 一 个 是 lib.c， 
男 外 Xcode 工程 名 用 的 是 mydyn， 编 译 构建 后 最 终生 成 libmydyn.dylib。 
lib2.c 定 义 了 一 个 hidden 可 见 性 的 函数 MyHiddenTest， 一 个 internal 可 见 
性 的 函数 MyInternalTest。 然 后 在 lib.c 源 文件 中 对 它们 声明 以 及 调用 。 
笔者 在 测试 的 时 候 将 最 后 生成 的 libmydyn.dylib 动 态 连接 库 文件 放置 在 
了 %Users/zennychen/” 用 户 根 目录 下 。 各 位 可 以 根据 自己 当前 的 环境 来 
设置 存放 动态 库 的 路 径 。 


代码 清单 17-27 ”macOS 中 对 可 见 性 属性 的 测试 〈 主 函数 ) 


// main.c 源 文件 
#include <stdio.h> 


// 此 头 文件 包含 了 运行 时 动态 加 载 动态 库 中 外 部 符号 的 API 


#include <dlfcn.h> 
int main(int argc, const char * argv[]) 


const char *path = "/Users/zennychen/libmydyn.dylib"; 


// 使 用 dlopen 函 数 加 载 动态 库 ， 返 回 动态 库 文件 句柄 
void *dylibHandle = dlopen(path, RTLD_NOW); 
if(dylibHandle == NULL) 

{ 


puts("dylib file not found!"); 
return 0; 


// 使 用 dlsym 范 数 加 载 1nternal 函 数 符号 
int (*pFunc)(void) = dlsym(dylibHandle, "MyInternalTest"); 
if(pFunc == NULL) 


puts("MyInternalTest function not found!"); 
else 


int a = pFunc(); 
printf("a = %d\n", a); 


// 使 用 dlsym 函 数 加 载 hidden 函 数 符号 
pFunc = dlsym(dylibHandle, "MyHiddenTest"); 
if(pFunc == NULL) 


puts("MyHiddenTest function not found!"); 
else 


int a 


= pFunc(); 
printf("a 


= %q\n", a); 


// 使 用 dlsym 函 数 加 载 外 部 对 象 符号 
void (*p)(void) = dlsym(dylibHandle, "MyExtDynFunc"); 
if(p == NULL) 
{ 
puts("dyn_runtime object not found!"); 
break; 


} 


p(); 
while(false); 


// 关闭 动态 库 文件 句柄 
dlclose(dylibHandle); 


我 们 通过 运行 代码 清单 17-27 的 主 程序 之 后 就 会 发 现 ， 我 们 在 动态 
库 中 所 定义 的 hidden 可 见 性 的 函数 MyHiddenTest 以 及 internal 可 见 性 的 函 


数 MyInternalTest 都 无 法 在 main 芳 数 中 加 载 。 我 们 只 能 加 载 到 默认 可 见 
性 的 MyExtDynFunc 范 数 。 


18.weak 


用 weak 属 性 修饰 的 具有 外 部 连接 的 对 象 或 函数 具有 一 个 弱 符 号 。 
这 意味 着 我 们 在 同一 模块 中 ， 或 者 在 男 一 模块 中 定义 相同 外 部 符号 名 
的 对 象 或 函数 ， 可 将 具有 weak 属 性 的 符号 给 覆盖 重 写 。 这 对 我 们 制作 
静态 连接 库 来 说 十 分 有 用 。 假 如 我 们 编写 了 一 个 静态 连接 库 A.a， 其 中 
引用 了 一 个 第 三 方 的 静态 连接 库 B.a， 而 最 终 应 用 开发 者 同时 引用 了 A.a 
与 C.a， 而 C.a 这 个 静态 连接 库 也 包含 了 B.a 的 内 容 ， 此 时 如 果 不 用 weak 
属性 修饰 B.a 的 外 部 符号 ， 那 么 就 会 引起 外 部 符号 重 定义 的 连接 时 错 
误 。 为 了 避免 引发 重复 包含 的 错误 ， 将 外 部 人 符号 声明 为 weak 属 性 是 比 
较 可 靠 的 方式 。 


此 外 ， 我 们 通过 weak 属 性 还 能 判定 当前 应 用 十 人 否 包 含 了 指定 的 静 
态 连接 库 。 比 如 ， 我 们 在 自己 的 应 用 中 用 weak 属 性 定义 某 个 需要 进行 
判定 的 外 部 函数 ， 如 果 我 们 的 应 用 包含 了 指定 的 静态 连接 库 ， 那 么 静 
态 连 接 库 中 非 weak 属 性 的 相同 外 部 符号 将 履 兰 我 们 应 用 里 目 己 写 的 
weak 属 性 的 外 部 符号 ， 从 而 能 正常 发 挥 作用 。 而 如 果 没 有 使 用 相应 的 
静态 连接 库 ， 也 不 会 引发 外 部 符号 未 定义 的 错误 。 如 果 我 们 在 主 程序 
中 含有 对 同一 函数 名 包含 多 个 weak 属 性 的 外 部 符号 ， 并 且 没 有 对 非 
weak 属 性 的 相应 符号 进行 定义 ， 那 么 具体 使 用 哪个 符号 的 定义 将 由 连 


接 器 安排 选择 ， 这 有 可 能 是 随机 的 。 但 如 采 有 一 个 相应 的 非 weak 属 性 
的 符号 存在 ， 那 么 连接 融 必 定 用 该 非 weak 属 性 的 外 部 符号 所 定义 的 内 


驴 


代码 清单 17-28 以 及 17-29 将 分 别 给 出 weak 属 性 外 部 符号 的 使 用 以 及 
效果 。 这 两 个 例子 都 是 在 ubuntu 16.04 中 完成 测试 的 。 


代码 清单 17-28 weak 属性 的 使 用 〈 静 态 库 代码 ) 


// 1Libc,c 源 文件 
int _ attribute ((weak)) OverridenFunc(void) 


return 10; 


const char *NonOverridenFunc(void) 


return "Hello"; 


// libc2.c 源 文件 
int _ attribute ((weak)) OverridenFunc(void) 


return 20; 


// build. sh 文件 
gcc -Std=gnu11 -c libc.c libc2.c 
ar cr libStaticTest.a libc.o libc2.0 


我 们 在 输入 代码 清单 17-28 中 的 代码 内 容 前 可 先 新 建 一 个 文件 夹 ， 
然后 分 别 创建 一 个 libc.c 源 文件 、libc2.c 源 文件 以 及 build.sh 文 件 。 这 里 
大 家 要 注意 的 是 ， 对 于 具有 相同 函数 名 的 不 同 weak 属 性 函数 的 定义 ， 
必须 将 它们 放置 在 不 同 源 文件 中 ， 使 得 它们 具有 独立 的 翻译 单元 ， 从 
而 拥有 不 同 的 文件 作用 域 和 上 下 文 。 如 果 将 它们 放 在 同一 源 文件 中 ， 
那么 在 编译 时 就 会 报错 。 在 libc.c 与 libc2.c 中 分 别 定义 了 名 为 


OverridenFunc 的 具有 weak 属 性 的 函数 。 而 在 libc.c 源 文件 中 还 定义 了 一 
个 具有 正常 外 部 连接 的 函数 NonOverridenFunc， 它 的 实现 将 不 可 被 再 次 
神社 * 


我 们 在 用 控制 台 进 入 该 工程 文件 来， 然后 输入 bash build.sh， 即 可 
编译 生成 静态 库 文件 ]ibStaticTest.a 文 件 。 随 后 ， 我 们 将 这 个 静态 库 文件 
放 入 主 程序 的 项 目 文件 夹 中 。 


代码 清单 17-29 ”weak 属 性 的 使 用 ( 主 程序 ) 


// main.c 源 文件 
#include <stdio.h> 


extern int OverridenFunc(void); 
const char* _attribute ((weak)) NonOverridenFunc(void) 


return NULL; 


int main(void) 


int a = OverridenFunc(); 
printf("a = %d\n", a); 


const char *s = NonOverridenFunc(); 
if(s == NULL) 
{ 


puts("Static library is not loded!"); 
return 0; 
printf("s = %s\n", s); 


// build. sh 文件 
gcc main.c -std=gnu11 -L./ -lsStaticTest -0 CTest 


我 们 进入 主 程序 main.c 所 在 的 文件 夹 ， 然 后 在 控制 台 输 入 bash 
build.sh， 即 可 编译 生成 最 终 的 CTest 可 执行 程序 。 我 们 运行 这 个 程序 之 


后 惑 会 发 现 OverridenFunc 的 返回 结果 会 选择 libStaticTest.a 文 件 中 的 其 中 


一 个 ;而 NonOverridenFunc 的 返回 将 始终 是 “Hello” 字 符 串 。 


如 有 果 各 位 在 macOS 环 境 下 ， 那 么 需要 注意 的 是 ， 从 Xcode 8 开始 ， 
我 们 在 静态 库 工 程 下 编译 ， 稚 认 的 外 部 符 扎 都 默认 为 weak 属 性 的 ， 即 
便 你 不 显 式 使 用 weak 属 性 也 是 如 此 。 因 此 这 会 使 得 我 们 做 静态 连接 之 
后 ， 即 便 在 主 程序 中 定义 了 一 个 与 静态 库 中 相同 名 称 的 函数 都 不 会 有 
任何 问题 ， 即 便 这 两 者 都 没 用 weak 属 性 去 显 式 修饰 。 


17.14.2 attribute ”用 于 修饰 对 象 的 属性 


用 于 修饰 对 象 的 属性 与 用 于 修饰 函数 的 基本 差不多 ， 因 此 这 里 将 
人 简略 介绍 ， 碰 到 与 画 数 有 所 不 同 的 属性 将 会 做 评 细 介绍 。 


1) aligned: 与 用 于 修饰 画 数 的 aligned 属 性 类 似 。 这 里 各 位 要 注意 
的 是 ，C11 标 准 所 引入 的 _Alignas 可 用 于 修饰 对 象 ， 因 此 我 们 最 好 用 
_Alignas 来 替代 ， 这 样 对 于 可 移植 性 而 言 也 会 更 好 一 些 。 


2) deprecated: 与 用 于 修饰 函数 的 deprecated 属 性 类 似 。 


3) mode: 这 个 属性 用 于 指定 声明 一 个 对 象 的 数据 类 型 ， 对 于 声明 
一 个 整数 对 象 ， 如 果 通 过 mode 属 性 ， 那 么 我 们 都 只 需要 用 int 或 
unsigned 类 型 即 可 ， 然 后 该 属性 将 会 把 所 声明 的 对 象 转换 为 能 适应 该 模 


式 长 度 的 相应 类 型 。GNU 语 法 扩展 文 持 三 种 数据 类 型 模式 的 声明 ， 分 
别 为 node (byte) ，mode (word) 以 及 mode (pointer) 。mode 

(byte) 表示 数据 类 型 是 字 节 ， 往 往 对 应 char 类 型 ，mode (word) 表示 
当前 处 理 器 的 自然 字 长 ， 在 32 位 系统 中 一 般 为 4 个 字 节 ，64 位 系统 中 一 
般 为 8 个 字 节 ; mode (pointer) 表示 当前 处 理 器 环境 下 ， 一 个 指针 所 占 
的 字 节 个 数 。 代 码 清单 17-30 将 展示 此 属性 的 使 用 与 效果 。 


代码 清单 17-30 ”对象 属性 mode 的 使 用 与 效果 


#include <stdio.h> 


#define OUTPUT_TYPE(expr) _Generic( (expr), \ 
signed char: puts("signed char"), 
unsigned char: puts("unsigned char"),\ 
signed short: puts("signed short"), \ 
unsigned short: puts("unsigned short"),\ 
signed int: puts("signed int"), \ 
unsigned int: puts("unsigned int"), \ 
signed long: puts("signed long"), \ 
unsigned long: puts("unsigned long"),\ 
signed long long: puts("sllong"), \ 
unsigned long long: puts("ullong"), \ 
default: puts("int")) 


int main(int argc, const char * argv[]) 


// 声明 对 象 a， 将 它 类 型 指明 为 字 节 模式 
Int _ attribute (( mode(byte) )) a = 100， 


// 声明 对 象 b， 将 它 类 型 指明 为 机 器 字 长 模式 
unsigned _ attribute_ (( mode(word))) b = 10000 


// 声明 对 象 address， 将 它 类 型 指明 为 地 址 模式 
int attribute ((mode(pointer))) address 


address = (size t)e&a; 


printf("a 
printf("b 


= %d\n", *(char*)address); 

= %tu\n", b); 

printf("size of a: %zu\n", sizeof(a)); 
printf("size of b: %zu\n", sizeof(b)); 
printf("size of address: %zu\n", sizeof(address)); 


OUTPUT_TYPE(a); 
OUTPUT_TYPE(b); 
OUTPUT_TYPE(address); 


4) packed: packed 属 性 可 用 于 修饰 一 个 一 般 对 象 ， 也 可 用 于 修饰 
结构 体 或 联合 体内 的 成 员 对 象 ， 用 于 指示 该 对 象 应 该 具有 最 小 可 能 的 
字 节 对 齐 。 对 于 一 个 普通 对 象 可 能 是 一 个 字 节 ; 对 于 一 个 结构 体 中 的 
位 域 ， 则 可 能 是 一 个 比特 。 如 果 我 们 同时 用 aligned 属 性 或 _Alignas 来 修 
饰 同一 对 象 ， 那 么 该 对 象 的 字 节 对 齐 将 按照 aligned 属 性 来 安排 。 代 码 
清单 17-31 展 示 了 packed 属 性 的 使 用 。 


代码 清单 17-31 ”对象 属性 packed 的 使 用 


#include <stdio.h> 
#include <stdint.h> 
#include <stdalign.h> 
#include <stddef.h> 


struct Test 
int8_t a; 
// 果 仅 仅 对 一 个 对 象 声 明 ，_ attribute 可 以 放 到 声明 尾部 


// 这 里 的 成 员 b 为 1 个 字 节 对 齐 
int b attribute_ ((packed) )， 


int16_t c; // 成 员 c 为 2 个 字 节 对 齐 
uint8_t d; 
// 这 里 的 成 员 e 为 1 个 字 节 对 广 


int64 t _ attribute ((packed)) e 
};// Test 结 构 体 最 后 以 这 里 字 对 齐 数 最 大 的 2 作为 最 终 大 小 的 倍数 ， 所 以 最 后 填充 了 1 个 字 市 


int main(int argc, const char * argv[]) 


int _ attribute ((packed)) a = 100 
int _ attribute __((packed)) a an b = 20; 


printf("align of a: %zu\n", alignof(a)); 
printf("align of b: %zu\n", alignof(b)); 
printf("size of Test: %zu\n", sizeof(struct Test)); 


// 各 位 可 以 通过 以 下 成 员 的 偏 移 地 址 就 能 观察 到 各 成 员 的 字 节 对 齐 情 ; 
printf("offset of a: %zu\n", offsetof(struct Test, 

printf("offset of b: %zu\n", offsetof(struct Test, b 
printf("offset of c: %zu\n", offsetof(struct Test, c 
printf("offset of d: %zu\n", offsetof(struct Test, d 
printf("offset of d: %zu\n", offsetof(struct Test, e 


J 

a)); 
); 
); 
); 
); 


这 里 各 位 要 注意 的 是 ， 在 GCC 更 高 版 本 以 及 Clang 编 译 器 中 ， 对 一 
般 对 象 声 明 packed 属 性 将 可 能 会 被 忽略 。 而 在 结构 体 中 对 成 员 对 象 进行 


声明 则 没有 问题 。 


5) section: 用 于 修饰 对 象 的 section 属 性 与 用 于 修饰 函数 的 类 似 ， 
可 参考 用 于 修饰 贸 数 的 介绍 。 


6) used/unused: 用 于 修饰 对 象 的 used/unused 属 性 与 用 于 修饰 函数 
的 类 似 ， 可 参考 用 于 修 贤 函数 的 介绍 。 


7) weak: 用 于 修 拭 对 象 的 weak 属 性 与 用 于 修 唉 函数 的 类 似 ， 可 参 
堵 用 于 修饰 钞 数 的 介绍 。 


8) dllimport/dllexport: 用 于 修饰 对 象 的 dllimport/dllexport 属 性 与 用 
于 修饰 玉 数 的 类 似 ， 可 参考 用 于 修饰 男 数 的 介绍 。 


17.14.3 attribute ”用 于 修饰 类 型 的 属性 


_ attribute ”也 可 用 于 修饰 结构 体 、 联 合体 以 及 枚 举 类 型 “有些 还 
能 用 于 修饰 枚 举 常 量 ) 。 用 于 修饰 类 型 的 属性 与 用 于 修饰 画 数 和 对 象 
的 也 基本 兰 不 多 。 因 此 这 里 将 简略 介绍 ， 碰 到 与 男 数 或 对 象 有 所 不 同 
的 属性 将 会 做 详细 介绍 。 


1) aligned: aligned 属 性 与 用 于 修饰 函数 的 类 似 ， 详 细 可 参考 函数 
属性 部 分 。 此 属性 可 以 用 来 修饰 枚 举 、 结 构 体 、 联 合体 以 及 类 型 定 
义 。 当 然 ， 最 大 可 能 的 对 齐 子 太 数 最 终 还 是 得 看 连接 絮 ， 如 来 超过 了 

连接 紫 所 能 文 持 的 对 章 字 广 数 ， 则 以 连接 器 的 最 大 子 太 对齐 数 进 行 
排 。 代 码 清 单 17-32 展 示 了 aligned 属 性 修饰 用 户 目 定义 类 型 的 示例 。 


代码 清单 17-32 ”aligned 属 性 修饰 用 户 目 定义 类 型 


#include <stdio.h> 
#include <stdalign.h> 


// 定义 MyStruct， 人 
// attribute __ 修饰 EE 义 类 型 时 ， 可 以 放 在 类 型 声明 的 末尾 
struct MyStruct 


Short a, b; 
} _attribute _((aligned(8))); 


// 定义 MY_ENUM 枚 举 类 型 ， 将 它 声明 为 8 字 节 对 广 
enum __attribute ((aligned(8))) MY_ENUM 


MY_ENUM_ONE, 
MY_ENUM_TWO 


// 字 节 对 齐 属性 用 于 修饰 typedef 名 


typedef int MY_ INT attribute ((aligned(8))); 
typedef short _attribute ((aligned(4))) MY_SHORT; 


int main(int argc, const char * argv[]) 


// MyStruct 结 构 体 由 于 8 了 对 齐 ， _ 所 以 最 终 7 小 必须 是 其 自身 字 节 对 齐 的 倍数 。 
// 原本 MyStruct 为 4 个 字 节 ， 这 里 需要 在 最 后 做 4 个 字 节 的 字 太 填充 ， 扩 充 到 8 字 节 
printf("The size of ee %zu\n", sizeof(struct MyStruct)); 


enum MY_ENUM me = MY_ENUM_ TWO; 


// 这 里 MY_ENUM 枚 举 对 象 me 仍 然 为 4 个 字 节 
printf("size of me: %zu\n", sizeof(me)); 


// 不 过 这 里 MY_ENUM 枚 举 对 象 me 为 8 字 节 对 齐 
printf("align of me: %zu\n", alignof (me)); 


printf("align of MY_INT: %zu\n", alignof (MY_INT)); 
printf("align of MY_SHORT: %zu\n", alignof (MY_SHORT)); 


2) packed: 这 里 对 类 型 使 用 packed 属 性 时 ， 可 以 针对 结构 体 与 联 
合体 类 型 ， 效 果 与 用 于 修饰 对 象 的 类 似 。 


3) unused: 这 个 属性 与 用 于 修饰 函数 和 对 象 的 类 似 ， 详 细 请 参考 
修饰 范 数 的 unused 属 性 。 


4) deprecated: 这 个 属性 与 用 于 修饰 函数 和 对 象 的 类 似 ， 详 细 请 参 
孝 修 饰 贸 数 的 deprecated 属 性 。 男 外 ， 从 GCC 4.9 以 及 Clang 3.6 起 ， 
deprecated 可 单独 用 于 修饰 一 个 枚 举 常 量 。 


17.15 ”本章 小 结 


本 章 主要 介绍 了 主要 的 一 些 GNU 扩 展 语 法 特性 ， 这 些 语法 特性 可 
以 在 GCC 4.9 或 更 高 版 本 以 及 Clang 3.8 及 更 高 版 本 上 进行 使 用 。 由 于 目 
前 大 部 分 主流 桌面 编译 器 以 及 肉 入 式 系 统 编 译 器 都 基于 GCC 与 Clang 编 
译 器 的 核心 ， 所 以 其 适用 范围 相当 广泛 。 同 时 ，GNU 语 法 扩展 也 是 针 
对 C 语 言 相 当 好 的 语法 体系 的 补充 ， 增 加 了 其 体系 的 完备 性 。 可 以 
说 ， 有 了 GNU 语 法 扩展 ，C 语 言 才能 真正 算是 一 门 现 代 化 的 高 级 编程 


三 局 


第 18 草 ”Clang 编 译 囊 对 C11 标 准 的 扩展 


第 17 章 给 大 家 描述 了 GNU 语 法 扩展 ， 这 些 扩展 可 以 给 GCC 和 
Clang 编 译 器 以 及 基于 这 些 编译 器 核心 打造 出 来 的 编译 工具 链 进 行使 
用 。 而 本 章 将 为 大 家 介绍 当前 最 为 先进 的 LLYM Clang 编 译 俩 针对 C11 
语法 扩展 特性 。 


单独 针对 Clang 编 译 器 做 介绍 也 是 有 很 多 缘由 的 。 首 先 ，Clang 编 
译名 是 整个 LLVM 项 目的 一 个 子 项 目 ， 它 是 C、C++ 以 及 Objective-C 编 
程 语言 的 编译 器 前 端 。 而 整个 LLVM 项 目 采用 的 是 UIUC 许 可 证 、 基 于 
MIT/X11 许 可 证 以 及 3 条 款 的 BSD 许 可 证 。 这 个 许可 证 比 起 GCC 的 著名 
GPL 许 可 证 要 宽松 很 多 。 这 意味 着 我 们 直接 获取 Clang 的 源 代 码 ， 然 后 
可 以 根据 自己 当前 的 目标 平台 做 适 配 ， 而 经 过 修改 的 代码 部 分 则 无 需 
开放 出 来 ， 这 一 点 在 GPL 许可 证 上 是 不 允许 的 。 正 因为 如 此 ， 它 广 受 
各 大 厂商 的 欢迎 。 而 且 LLVM 项 目 最 初 由 Swift 编程 语言 创始 人 Chris 
Lattner 在 大 学 里 发 起 ， 然 后 被 Apple 看 中 ，Apple 在 LLVM 上 做 了 大 力 投 
资 ， 后 来 又 开局 了 目 己 的 一 个 分 文 ， 称 为 Apple LLVM。 因 此 我 们 现在 
从 Xcode 4 开始 起 用 的 LLYM 编 译 器 都 称 为 Apple LLVM 编 译 器 ， 而 
Apple LLVM 编 译 器 又 是 从 标准 的 LLVM 主 干 上 拉 下 来 的 。 


此 外 ，Google 也 是 从 NDK 9 开始 起 大 力 推广 LLVM Clang 编 译 工具 
链 。 而 且 在 NDK 11 中 就 有 官方 声明 ，GCC 编 译 絮 只 升级 到 4.9， 后 续 
将 处 于 维护 状态 ， 然 后 NDK 13 版 本 将 直接 被 丢弃 ， 而 只 使 用 LLVM 
Clang 编 译 工 具 链 。 再 看 看 ARM，ARM 官 方 的 编译 工具 链 ARM Studio 
6 也 开始 基于 Clang。 而 像 AMD 则 是 把 Clang 直 接 用 于 自己 的 OpenCL 编 


译 器 上 。 


到 了 2017 年 ， 微 软 也 将 Clang 集 成 在 Visual Studio 开 发 环境 中 ， 作 
为 可 选 的 C 语 言 编 译 露 前端， 而 后 端 仍然 采用 MSVC 的 目标 代码 生成 右 
以 及 运行 时 。 


可 见 ，Clang 作 为 C 语 言 的 编译 右前 病 已 经 被 炒 得 如 此 狂热 了 。 对 
于 我 们 开发 者 来 说 ， 如 果 当 前 在 做 iOS 以 及 Android 应 用 开发 ， 那 么 请 
别 犹 驳 ， 直 接 使 用 Clang 编 译 器 (当然 ， 这 也 没 得 选 ) ， 使 用 它 的 语法 
扩展 吧 。 而 且 在 macOS、iOS、watchOS 以 及 tvOS 的 开发 框架 中 ， 已 经 
有 不 少 API 都 直接 使 用 了 Clang 语 法 扩展 ， 比 如 后 面 会 讲 到 的 Blocks 语 
法 。 这 些 在 Android 开 发 上 也 都 能 使 用 ， 后 面 会 进行 介绍 。 


如 果 我 们 使 用 了 Clang 编 译 咒 ， 那 么 编译 絮 束 会 目 动 定 义 预 编译 宏 
_clang ， 表 示 当 前 用 的 是 Clang 或 基于 Clang 的 编译 工具 链 。 此 外 ， 
__GNUC_ 这 个 预 编 译 宏 也 会 被 定义 ， 说 明 当 前 编译 做 遵循 GNU 语 法 
外 懂 ” 


18.1 特征 检查 安 


特征 检查 宏 是 一 组 用 于 检查 当前 Clang 编 译 器 是 否 具有 某 些 语法 特 
性 或 是 否 文 持 指 定 的 内 建 画 数 的 宏 ， 这 些 宏 都 以 两 条 下 划 线 打头 。 比 
如 ， 像 _has_builtin 用 于 检查 当前 Clang 编 译 器 是 否 支持 指定 的 内 建 函 
数 。 has feature 与 “has_extension 这 两 个 宏 用 得 较 多 ， 用 于 检查 当前 
编译 器 是 否 文 持 所 指定 的 语法 特征 。_has_attribute 则 用 于 检查 当前 编 
译 絮 是 否 文 持 所 指定 的 属性 。 男 外 还 有 __has_include 宏 则 用 于 检查 当 

前 上 下 文中 是 否 包含 了 所 指定 的 文件 。 关 于 特征 检查 这 个 语法 特性 ， 

其 内 容 比 较 繁杂 ， 但 同时 语法 却 比较 简单 ， 各 位 可 以 参考 这 个 网 页 上 
的 内 容 : http://clang.llvm.org/docs/LanguageExtensions.html 。 


18.2 “Nullable 与 Nonnull 


Clang 编 译 器 当然 也 文 持 GUN 语 法 扩展 中 的 nonnull 属 性 ， 但 是 对 
于 每 个 需要 指定 函数 形 参 不 能 为 空 的 参数 都 要 用 __attribute 
( nonnul) ) 去 修 陋 显然 太 过 党 珊 ， 而 且 使 得 代码 也 显得 比较 元 
长 。 而 在 Clang 编 译 器 中 ， 则 直接 引入 了 _Nullable 〈 前 面 带 有 一 条 下 划 
线 ) 限定 符 用 于 修饰 指针 类 型 的 函数 形 参 对 象 可 以 为 空 ， 用 _Nonnull 
(前 面 带 有 一 条 下 划 线 ) 限定 符 用 来 表示 当前 所 修饰 的 指针 类 型 的 形 
参 对 象 不 可 为 空 。 此 外 ， 这 两 个 关键 字 还 能 用 于 修饰 画 数 的 返回 类 
型 ， 如 果 画 数 返回 类 型 为 指针 类 型 的 话 。 引 入 这 两 个 限定 符 一 来 是 提 
高 代码 的 简洁 性 ， 尽 管 我 们 也 可 以 自己 定义 宏 用 来 简化 _attribute__ 
( onnull) ) ; 二 来 是 为 了 能 更 好 地 将 我 们 用 C 语 言 定义 的 外 部 全 
局 函数 输出 给 其 他 编程 语言 进行 使 用 ， 比 如 Swift。 像 Swift 文 种 编程 语 
言 有 Optional 语 法 特性 ， 需 要 指明 当前 函数 形 参 是 否 可 以 为 至 ， 如 果 不 
能 为 空 ， 我 们 必须 使 用 _Nonnull 限 定 符 来 修饰 该 形 参 指针 对 象 。 


另外 各 位 要 注意 的 是 ，Apple 在 Apple LLVM 6.0 中 就 引入 了 
_ nonnull 与 ”nullable， 这 两 者 都 还 能 使 用 ， 但 推荐 使 用 Clang 标 准 化 
的 _Nonnull 与 _Nullable， 它 俩 在 其 他 基于 Clang 编 译 器 前 端的 编译 工具 
链 上 也 能 使 用 。 代 码 清单 18-1 展 示 了 _Nullable/_Nonnull 属 性 的 使 用 。 


代码 清单 18-1 _Nullable/ Nonnull 属 性 的 使 用 


#include <stdio.h> 
static void MyFunc(int* _Nonnull p, int* _Nullable 9q) 


if(p == NULL) 
return; 
if(q != NULL) 
“p= *q; 
else 
“p= 0; 


int main(int argc, const char * argv[]) 
int a = 10, b = 20; 


MyFunc(&a, &b); 
printf("a = %d, b = %d\n", a, b) 


/ 
// 如 果 第 一 个 参数 传 室 ， 那 么 编译 器 会 发 出 警告 
MyFunc(NULL, NULL); 


// 由 于 第 二 个 参数 可 以 为 空 ， 所 以 这 个 调用 不 会 有 任何 警告 
MyFunc(&a, NULL); 
printf("a = %d\n", a); 


代码 消 单 18-1 中 ， 函 数 MyFunc 具 有 两 个 指向 int 类 型 的 指针 参数 p 
和 q。 其 中 形 参 p 用 _Nonnull 修 饰 ， 生 命 表 示 它 不 能 为 空 ， 形 参 q 用 
_Nonnull 修 饰 ， 声 明 它 可 以 为 空 。Clang 编 译 器 会 在 编译 时 做 静态 代码 
分 析 ， 如 果 在 调用 MyFunc 时 ， 将 空 (NULL) 传递 给 形 参 p， 那 么 纺 


译 套 承 会 发 出 警告 


18.3 ”函数 重 载 


函数 重 载 是 一 个 高 级 编程 语言 常用 特性 ， 现 在 很 多 高 级 编程 语言 
都 支持 该 语法 特性 ， 包 括 C++、Java、C#、Swift， 等 等 。 那 么 什么 是 
函数 重 载 呢 ? 简单 来 说 ， 就 是 在 同一 单元 翻译 中 定义 了 一 组 相同 名 称 
的 函数 ， 这 些 函 数 具 有 不 同 的 参数 类 型 或 参数 个 数 ， 那 么 我 们 称 这 组 
函数 为 重 载 函数 (overloaded functions) 。 倘 若 这 组 函数 中 有 任意 两 个 
函数 的 参数 类 型 与 个 数 都 完全 相同 ， 那 么 编译 器 仍然 会 报 有 类 型 钟 突 


的 错误 。 


Clang 中 通过 使 用 _attribute 。 ( (overloadable) ) 这 一 函数 属性 
说 明 符 将 一 个 函数 指示 为 可 重 载 的 。 各 位 要 注意 的 是 ， 对 于 一 组 重 载 
函数 ， 我 们 需要 将 它们 每 一 个 都 用 _attribute  ( (overloadable) ) 画 
数 说 明 符 进行 修饰 ， 如 果 漏 了 一 个 ， 那 么 那个 函数 将 会 报 出 类 型 冲突 
的 错误 。 下 面 通过 代码 清单 18-2 来 给 大 家 展示 一 下 函数 重 载 的 表现 方 
式 o 


代码 请 单 18-2 ”Clang 编 译 絮 中 使 用 函数 重 载 特 性 


#include <stdio.h> 
static void _attribute _((overloadable)) Func(void) 


puts("This is a function!"); 


static void _attribute _((overloadable)) Func(int a) 


printf("a = %d\n", a); 


static void 


printf(" 


static void 


printf("The character is: 


static void 


printf("The sum is: 


这 


* 


~ * * X* 


即便 


画 
秘 


static int 


{ 


的 返 


= %f\n", f); 


数 会 报 类 型 冲突 的 错误 ， 因 为 它 


_attribute _((overloadable)) Func(float f) 


_attribute _((overloadable)) Func(char c) 


%c\n", c); 


attribute ((overloadable)) Func(unsigned a, short b) 


Ox%.8X\n", a + b); 


可 类 型 与 第 一 个 Func 


与 第 一 个 Func 一 样 ， 形 参 


有 所 不 同 


™ 
es 

二 | 
让 
过 
册 


__attribute _((overloadable)) Func(void) 


return 10; 


int main(int argc, const char * argv[]) 


// 这 本 
Func() 


// 这 本 
Func( 


// 这 本 
Func( 


Func('c'); 


ds a 也 就 将 int 类 型 转换 为 了 char 类 型 ， 
Jj ] 芒 


// 


昌 调 日 


的 是 void Func(void) 画 数 


昌 调 上 


00 ) 


的 是 void Func(int al) 函 数 


昌 调 日 
10.25f); 


多 是 void Func(float 于) 函数 


这 里 调用 的 也 是 void Func(int al) 画 数 ， 


前 我 们 已 经 讲 到 了 ， 


C 语 言 9 


ph 像 'c' 这 种 字符 字面 量 默认 为 nt 类 型 


的 就 是 void Func(char c) 画 数 
char)'c'); 


Func(OxcOde0000, Ox1314); 


一 


了 void Func(int a，short b) 函 数 


通过 代码 请 单 18-2 我 们 发 现 ， 使 用 函数 重 载 将 会 使 得 函数 接口 变 


得 十 分 简 


we 二 
; 百 


° 对 于 实现 相同 功能 的 函数 ， 我 们 无 需 通过 改变 函数 名 整 


能 给 不 同类 型 的 参数 或 者 不 同 个 数 的 参数 做 相应 的 函数 调用 了 。 我 们 


在 使 用 具有 函 


数 重 载 特性 的 一 


组 函数 时 需要 注意 ， 像 代码 清单 18-2 中 


所 示 的 ， 如 果 我 们 要 传 的 一 些 实 参 的 类 型 与 想 要 调用 的 那个 芳 数 的 形 
参 类 型 不 匹配 ， 那 么 我 们 此 时 需要 使 用 类 型 投射 操作 ， 将 实 参 类 型 显 
式 地 转换 为 相应 函数 的 形 参 类 型 ， 否 则 可 能 会 调用 到 我 们 本 不 想 调 用 
的 那个 函数 。 


18.4 ”Blocks 语 法 


Blocks 语 法 是 Apple 在 Apple LLVM 2.0 中 贡献 给 LLVM 开 源 社 区 的 C 
语言 扩展 语法 特性 。 这 里 的 Blocks 不 是 指 我 们 C 语 言 中 的 语句 块 ， 而 是 
一 种 Lambda 表 达 式 ， 由 于 它 可 以 像 语句 块 那样 定义 在 函数 体内 ， 所 以 
将 此 语法 命名 为 Blocks。 为 了 避免 混淆 ， 后 续 提 及 到 Blocks 语 法 时 一 律 
用 Blocks 英 文 给 出 ， 而 对 于 普通 语句 块 ， 则 直接 称 其 为 “语句 块 ”。 


在 开讲 Blocks 语 法 之 前 ， 我 们 首先 简单 介绍 一 下 两 个 基本 概念 ， 一 
个 是 Lambda 表 达 式 (Lambda 是 希腊 字母 ) ， 还 有 一 个 是 闭 包 


(Closure) 。 


在 计算 机 编程 领域 ，Lambda 表 达 式 也 称 作为 匿名 函数 ， 它 可 以 像 
函数 那么 定义 ， 也 可 以 做 函数 调用 ， 但 不 需要 给 出 函数 名 。 在 计算 机 
编程 语言 领域 中 ， 闭 包 也 称 为 词法 闭 包 (lexical closure) 或 函数 闭 包 
(function closure) ， 在 具有 头等 函数 的 编程 语言 (主要 是 函数 式 编程 
语言 ) 中 用 于 实现 词法 作用 域 的 名 字 绑 定 (exically scoped name 
binding) 。 在 操作 上 ， 闭 包 是 一 条 记录 ， 它 将 一 个 函数 与 它 目 己 的 上 
下 文 存放 在 一 起 。 当 我 们 在 某 一 个 函数 里 创建 财 包 的 时 候 ， 此 闭 包 将 
该 国 数 中 每 一 个 与 目 己 相 关联 的 局 部 对 象 映射 为 目 己 所 绑 定 的 名 字 。 


至 此 我 们 可 以 看 到 ， 一 个 Lambda 表 达 式 如 果 可 作为 闭 包 ， 那 么 必 
须 满足 两 个 条 件 : 第 一 ， 它 能 绑 定 自己 所 在 函数 的 局 部 对 象 ， 第 二 ， 
它 必 须 有 自己 独立 的 执行 环境 ， 使 得 所 绑 定 的 局 部 对 象 能 始终 在 其 自 
己 的 执行 环境 中 维护 ， 这 一 点 也 是 判定 一 个 Lambda 表 达 式 是 否 可 作为 
闭 包 的 最 为 关键 的 一 点 。 根 据 这 两 个 条 件 ， 我 们 可 以 得 出 ， 像 Java 8 中 
的 匿名 Lambda 表 达 式 严格 意义 上 不 属于 闭 包 ， 因 为 它 对 自己 所 绑 定 的 
局 部 对 象 的 维护 特性 非常 薄弱 ， 它 只 能 绑 定 溃 量 ， 而 不 能 绑 定 变量 ， 
并 且 还 有 其 他 许多 约束 。 而 C++11 的 Lambda 表 达 式 上 自身 也 不 具备 保存 
自己 执行 环境 的 接口 ， 只 能 通过 借助 sd: : function 做 Lambda 表 达 式 执 
行 环境 的 拷贝 与 封装 ， 这 样 才能 把 Lambda 表 达 式 拷贝 到 函数 外 执行 。 
我 们 后 面 可 以 看 到 ，Clang 中 的 Blocks 语 法 就 是 相当 标准 的 闭 包 。 


下 面 我 们 将 引入 Blocks 引 用 类 型 以 及 Blocks 定 义 的 语法 形式 ， 同 时 
我 们 也 将 结合 上 面 涉及 的 一 些 术语 做 更 明了 的 介绍 。Blocks 的 引用 类 型 
与 函数 指针 类 型 十 分 类 似 ， 我 们 只 需要 把 函数 指针 类 型 中 的 * 符 号 改 为 
^ 符 号 即 可 。 比 如 ， 我 们 声明 一 个 指向 函数 的 指针 对 象 ， 像 void 

(*pFunc) (int) ;表示 声明 一 个 函数 指针 对 象 pPFunc， 它 所 指向 的 郴 
数 类 型 为 void (int) 。 而 如 果 是 一 个 Block 引 用 对 象 的 声明 也 类 似 : 
void (ArefBlock) (int) ; 表示 声明 了 一 个 对 Block 的 引用 对 象 ， 它 所 
引用 的 Block 类 型 为 void \A) (int) 。 从 上 面 这 两 句 话 中 我 们 就 可 以 看 
到 一 个 Block 引 用 类 型 与 指向 函数 指针 类 型 的 形式 十 分 相似 。 而 定义 一 
个 类 型 为 void (^) (int) 的 Block 可 以 如 下 : Avoid (inta) {printf 


(“a=%d\n”，a) ; } 是 非常 简单 。 这 个 Block 的 返回 类 型 为 void， 并 
且 含有 一 个 int 类 型 的 参数 。 从 对 Block 的 定义 上 我 们 也 可 以 看 到 ，Block 
目 身 是 没有 标识 符 的 ， 它 驶 是 一 个 纯粹 的 表达 式 。 


我 们 将 通过 代码 清单 18-3 来 介绍 上 面 提 到 的 一 些 术 语 。 不 过 在 此 之 
前 ， 如 有 果 各 位 是 在 Debian/Ubuntu 系 统 上 编程 的 话 ， 那 么 可 以 通过 在 命 
令 行 输入 以 下 命令 来 安装 Clang 以 及 使 用 Blocks 和 Grand Central Dispatch 
所 需要 的 库 。 


sudo apt-get install llvm 

sudo apt-get install clang 

sudo apt-get install libblocksruntime-dev 
sudo apt-get install libdispatch-dev 


第 三 条 命令 可 以 先 不 用 输入 ， 因 为 Clang 本 映 所 市 的 一 些 库 可 能 
经 包 售 了 Blocks 的 运行 时 。 如 采 我 们 在 使 用 Blocks 时 发 生 了 连接 错误 ， 
那么 可 以 安装 blocksruntime-dev。 另 外 ， 我 们 在 Windows 以 及 除了 
macOS/iOS 以 外 的 类 Unix 系 统 环境 下 通过 Clang 来 编译 使 用 Blocks 的 C 代 
码 的 时 候 ， 必 须 使 用 -fblocks 编 译 命 令 选 项 ， 指 示 编 译 釉 开局 Blocks 语 
法 ， 然 后 使 用 -IBlocksRuntime 命 令 选 项 来 连接 Blocks 所 需要 的 运行 时 
库 。 如 果 我 们 还 想 使 用 Grand Central Dispatch， 则 再 添加 -ldispatch 命 令 
选项 。 而 在 macOS 中 ，Xcode 已 经 帮 有 我 们 做 了 一 切 ， 我 们 只 需要 直接 点 
击 三 角 箭 头 按钮 编译 构建 即 可 。 如 果 各 位 用 的 是 windows 和 Android ， 
那么 可 以 从 这 个 地 址 下 载 到 blocksruntime-dev 的 源 代 码 ， 然 后 可 以 自己 
做 成 库 或 是 直接 将 源 代码 放 入 目 己 的 项 目 工程 中 : 


泛 


Ee 


https://github.com/mackyle/blocksruntime。 这 个 项 目 基 于 UIUC 与 MIT 双 
重 许可 证 ， 各 位 可 以 放心 大 胆 地 使 用 。 这 里 只 需要 BlocksRuntime 目 录 
下 的 Block.h、Block_private.h、data.c 以 及 runtime.c 这 4 个 文件 ， 以 及 根 
目录 下 的 config.h 这 个 文件 即 可 。 此 外 ， 对 于 现在 Visual Studio 2017 
Community 中 的 VS-Clang， 如 果 使 用 _block 对 象 进行 捕获 ， 那 么 代码 
生成 会 有 问题 ， 一 旦 使 用 _block 对 象 捕 获 就 会 引发 异常 。 所 以 在 
Windows 系 统 下 ， 仍 然 建议 各 位 使 用 纯 Clang 编 译 器 做 后 续 对 Blocks 的 
实践 。 


代码 清单 18-3 ”Blocks 语 法 的 初步 使 用 


#include <stdio.h> 


int main(int argc, const char * argv[]) 


// 在 main 函 数 中 声明 局 部 对 象 a， 并 将 它 初 始 化 为 10 
int a = 10; 


// 声明 一 个 对 void(^A) (int ) 类 型 的 Block 的 引用 对 象 ， 个 Block 对 它 初 始 化 
void (^refBlock)(int) = 人 ^void(int i) { 
printf("a + i = %d\n", a + i); 


了 


a = 20; 

// 对 Block 引 用 对 象 做 一 次 调用 
refBlock(1); // 输出 : a + i = 11 
a = 30; 

// 对 Block 引 用 对 象 再 做 一 次 调 
refBlock(1); // 输出 : a + i = 11 


printf("a = %dxn"，a); // 输出 : a = 30 


下 面 我 们 就 来 分 析 代码 清单 18-3 中 Block。 代 码 清 单 18-3 中 ， 我 们 
先 在 main 函 数 中 声明 了 一 个 局 部 对 象 a， 然 后 声明 了 一 个 Block 引 用 对 象 


refBlock， 并 定义 了 一 个 Block 对 该 引用 对 象 进行 初始 化 。 这 里 ， 我 们 
所 创建 的 Block 的 词法 作用 域 就 是 main 函 数 中 的 语句 块 作用 域 。 然 后 ， 
Block 中 的 对 象 a 就 是 对 main 函 数 中 的 局 部 对 象 a 的 名 字 绑 定 。Block 中 的 
a 是 在 创建 此 Block 时 就 已 经 被 创建 好 了 ， 它 是 将 main 函 数 的 局 部 对 象 a 
的 当前 值 ， 也 就 是 在 创建 该 Block 之 前 那 一 刻 的 值 ， 找 贝 到 Block 中 的 局 
部 对 象 4 里 的 ， 这 一 过 程 就 是 本 市 一 开始 所 介绍 的 名 字 绑 定 。 


接 下 去 ， 我 们 发 现 无 论 main 函 数 的 局 部 对 象 ab 值 怎 么 修改 ， 在 
Block 中 在 它 创 建 时 所 绑 定 的 a 的 值 不 会 有 任何 改变 。 因 此 我 们 先后 两 次 
调用 了 refBlock 对 象 所 引用 的 Block， 无 论 main 函 数 的 对 象 a 怎 么 修改 ， 
输出 的 结果 都 是 一 样 的 。 


下 面 ， 我 们 用 图 18-1 来 描述 Blocks 语 法 与 相关 计算 机 编程 术语 的 对 


Block 的 引用 对 象 
void (^refBlock)(int) = 


^ void(int i) { 


printf("a + i = %d\n", a + i); 


}; 名 字 绑 定 


图 18-1 Blocks 语 法 与 计算 机 编程 术语 的 对 应 


在 图 18-1 中 我 们 可 以 看 到 ，refBlock 对 象 是 对 Block 的 一 个 引用 ， 它 
就 如 同 扮演 函数 指针 一 般 的 角色 ， 通 过 refBlock 可 以 直接 调用 由 该 对 象 
所 引用 的 Block。 加 粗 的 矩形 围 住 的 部 分 就 是 一 个 Block， 它 通过 一 个 前 
导 ^ 符 号 引入 ， 后 面 跟着 此 Block 伴 随 实现 的 返回 类 型 以 及 形 参 列表 ， 这 
与 函数 体 的 定义 相同 ， 也 是 用 一 对 {f} 来 围 住 对 此 Block 的 实现 。 而 用 加 
粗 的 矩形 所 围 住 的 定义 整个 Block 的 表达 式 就 被 称 为 Lambda 表 达 式 ， 它 
对 于 Block 而 言 也 是 一 个 财 包 。 


在 Block 的 实现 中 引用 了 该 Block 所 在 函数 的 局 部 对 象 a， 由 于 Block 
有 其 自己 独立 的 执行 环境 ， 所 以 Block 中 的 对 象 a 其 实 与 范 数 局 部 对 象 a 
是 两 个 不 同 的 对 象 ， 而 在 这 条 Block 表 达 式 执行 完 之 时 ， 它 所 绑 定 的 a 已 
经 将 其 外 部 函数 局 部 对 象 a 的 值 拷贝 进来 了 。 因 此 ， 在 Block 里 的 a 的 值 
征 不 能 被 修改 的 ， 因 为 它 是 只 读 的 。 同 时 ， 此 后 无 论 外 部 函数 局 部 对 
象 a 的 值 怎 么 改变 ， 对 Block 里 的 a 的 值 是 不 会 有 任何 影响 的 。 


至 此 我 们 可 能 会 有 这 么 个 疑问 : 如 果 Block 中 所 绑 定 的 外 部 对 象 的 
值 不 能 修改 ， 那 么 它 跟 真正 的 闭 包 不 是 还 有 一 定 奔 距 么 ? 而 且 实用 性 
也 大 打折 扣 。 确 实 如 此 ， 现 在 Java 8 对 Lambda 表 达 式 的 实现 也 仅仅 做 到 
这 一 步 而 已 ， 但 Blocks 语 法 则 没 那么 简单 。Blocks 语 法 中 引入 了 _ block 

(前 面 带 有 两 条 下 划 线 ) 关键 字 用 来 修饰 可 被 Blocks 以 传 引用 的 方式 所 
绑 定 的 对 象 。 我 们 查看 代码 清单 18-4 的 示例 。 


代码 清单 18-4 ”外 部 函数 对 象 以 引用 的 方式 绑 定 给 Block 


#include <stdio.h> 
int main(int argc, const char * argv[]) 


// 在 main 醒 数 中 声 明 对 象 a 
int a = 10， 


// 在 main 画 数 中 声明 对 象 b， 对 象 b 将 以 引用 的 方式 绑 定 到 BlLock 中 去 
”block int b = 20; 


// 这 里 直接 定义 一 个 Block 而 不 声明 指向 它 的 一 个 引用 对 象 ， 然 后 直接 调 
Avoid(void) { 
a++; // 这 人 句 对 a 的 修改 将 会 报错 
// 下 面 这 人 旬 没 有 问题 ， de 引用 的 方式 绑 定 到 Block 中 的 对 象 b 的 。 


了 对象 b 的 地 址 ; 
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// 1) 先 通过 Block 中 的 b 获 取 二 让 的 
// 2) 对 外 部 对 象 b 做 b += a 的 操作 
) 将 结果 值 存放 到 外 部 对 象 b 中 


} 
// 直接 对 该 Block 进 行 调 用 
(); 


printf("b = %dxn"，b); // 我 们 将 观察 到 ，b 的 值 变 为 了 30 


// 在 定义 一 个 Block 时 ， 如 果 其 返 匠 类 型 为 void 那么 void 可 省 ; 

// 如 果 其 参数 列表 为 空 ， 那 么 参数 列表 也 可 

void (^refBlock)(void) = 
printf("Current b = %d\n", b); 


b += a; 


printf("After modified, b = %d\n", b); 


}; 

// 我 们 这 里 将 b 的 值 修改 为 25 

b -= 5; 

// 调用 Block， 我 们 发 现在 Block 中 ，b 一 开始 的 值 为 25， 然 后 它 被 修改 成 了 35 
refBlock(); 

// 我 们 再 观察 当前 外 部 函数 局 部 对 象 b 的 值 ， 发 现 b 也 变 成 了 35 


printf("b = d\n b); 


通过 代码 清单 18-4 我 们 可 以 发 现 ， 用 _block 所 修饰 的 局 部 对 象 b， 
当 把 它 绑 定 到 一 个 Block 中 的 时 候 ， 其 实 相 当 于 是 把 它 的 地 址 传 入 进 
去 ， 而 不 是 它 当 前 的 值 。 而 在 Block 中 访问 b 的 时 候 其 实 也 是 通过 Block 
里 所 绑 定 的 b 的 地 址 去 访问 其 值 的 ， 这 人 么 一 来 束 可 以 通过 该 地 址 来 修改 
外 部 局 部 对 象 b 的 值 了 。 因 此 说 用 _block 所 修饰 的 局 部 对 象 b 绑 定 到 


Block 的 过 程 其 实 是 传 引用 的 过 程 ， 而 没有 用 _block 所 修饰 的 局 部 对 和 象 
a 绑 定 到 Block 的 过 程 其 实 是 传 值 的 过 程 。 图 18-2 给 出 了 Block 绑 定 外 部 
局 部 对 象 的 结构 示意 图 。 


int a = 10; a 的 地 址 : 0x0100 


__block int b = 20; b 的 地 址 : 0x0104 


^ 《Block 中 a 的 地 址 : 0x1000 


Block 中 b 的 地 址 : 0x1008 


b += 3; 
0x1008 Ox0104 


图 18-2 Block 绑 定 外 部 局 部 对 象 的 结构 示意 图 


从 图 18-2 中 我 们 可 以 看 到 ， 对 于 一 条 b+=a; 这 人 么 简单 的 语句， 在 
Block 中 的 实际 操作 过 程 是 比较 复杂 的 。 这 里 的 复杂 点 十 对 b 的 处 理 
一 一 先 获得 外 部 局 部 对 象 b 的 地 址 ， 然 后 再 读 取 该 地 址 的 内 容 ， 与 
Block 中 的 a 相 加 之 后 再 写 回 到 外 部 局 部 对 象 b 的 地 址 中 去 。 为 外 ， 在 图 


18-2 中 我 们 可 以 看 到 当 Block 创 建 完 之 后 ，Block 中 a 的 地 址 假设 为 
0x1000， 其 存放 的 数据 就 是 外 部 对 象 a 的 值 ， 而 b 的 地 址 假定 为 
0x1008， 而 该 地 址 所 存放 的 数据 则 是 外 部 对 象 b 的 地 址 ， 而 不 是 此 对 象 
b 的 值 。 


我 们 清楚 了 Block 内 部 的 处 理 机 制 之 后 ， 下 面 我 们 束 要 讨论 如 何 传 
迎 Block 引 用 了 。 因 为 Block 是 一 个 代码 块 ， 它 的 实现 可 以 非 第 灵活 ， 比 
如 可 以 与 它 所 在 的 函数 共享 同一 代码 空间 ， 也 可 以 把 Block 中 的 代码 存 
放 到 其 他 代码 存储 段 中 。 但 是 其 执行 上 下 文 (也 就 是 执行 环境 ) 必须 
得 到 安全 维护 ! 我 们 知道 ， 一 旦 退出 了 一 个 函数 体 ， 那 么 该 函数 中 的 
所 有 局 部 对 象 都 会 被 目 动 销 毁 ， 而 Block 的 执行 上 下 文 其 实在 存储 类 型 
上 来 说 也 是 auto 类 型 的 ， 它 与 当前 所 在 的 函数 共享 同一 个 栈 空 间 ， 跟 该 
函数 中 的 局 部 对 象 一 样 。 这 么 做 有 两 大 好 处 ， 首 先 在 我 们 不 想 把 函数 
中 所 定义 的 Block 传 到 外 部 的 时 候 ， 在 函数 内 对 Block 的 实现 可 以 做 很 大 
优化 ， 比 如 在 Clang 的 实现 中 是 把 外 部 函数 中 用 _plock 所 声明 的 对 象 与 
Block 中 跟 它 绑 定 的 对 象 作 为 同一 个 实体 ， 也 就 是 说 两 者 共享 同一 栈 存 
储 单元 ， 其 次 ， 如 果 在 每 次 调用 函数 的 时 候 都 要 创建 一 次 其 内 部 的 
Block 执 行 上 下 文 ， 那 么 什么 时 候 释 放 该 Block 的 执行 上 下 文 呢 ? 这 是 个 
问题 。 因 此 Blocks 语 法 中 引入 了 运行 时 库 <Block.h>， 这 个 库 中 有 两 个 
实 汞 数 接口 
分 配 一 块 存储 空间 ， 然 后 将 所 指定 的 Block 的 执行 上 下 文 拷贝 到 分 配 的 
存储 空间 中 。Block_release 则 是 释放 所 指定 的 Block 执 行 上 下 文 。 当 我 


Block_copy 与 Block_release。Block_copy 接 口 是 先 动态 


们 要 把 在 某 个 函数 中 定义 的 Block 传 递 到 其 他 模块 执行 前 ， 可 以 通过 
Block_copy 接 口 将 指定 的 Block 上 下 文 动态 分 配给 该 Block 引 用 的 持 有 
者 ， 然 后 由 该 持 有 者 目 己 管理 何 时 通过 Block_release 进 行 释放 。 代 码 清 
单 18-5 将 展示 这 对 接口 的 用 法 。 


代码 清单 18-5 ”Block 执行 环境 的 保存 与 释放 


#include <stdio.h> 
struct MyObject 

int a; 

void (^block)(int); 
}; 


/** 通过 动态 分 配 存储 空间 的 方式 创建 一 个 My0bject 结 构 体 对 象 并 返回 将 其 首 地 址 返回 */ 
struct MyObject *CreateMyObject(void(^ _Nullable refBlock)(int)) 


struct MyObject *pobj = malloc(sizeof(*p0Obj)); 
pobj->a = 1; 


// 如 果 refBlock 不 空 ， 则 拷贝 其 执行 上 下 文 ， 并 将 拷贝 之 后 的 引用 赋值 给 block 成 员 
if(refBlock != NULL) 

pObj->block = Block_copy(refBlock); 
else 

pObj->block = NULL; 


return pObj; 
} 


/** 销毁 指定 的 My0bject 结 构 体 对 象 */ 
void DestroyMyObject(struct MyObject* _Nullable pob]j ) 


// 如 果 p0bj 所 指向 的 对 象 不 空 ， 则 将 它 释放 
if(pobj != NULL) 
{ 


// 先 释放 p0bj 的 block 成 员 
if(pObj->block != NULL) 
Block_release(p0Obj->block); 
free(p0bj ) ; 
} 
static struct MyObject* Test(void) 


int a = 10; 
”block int b = 20; 


printf("address of a: %.16txX\n", (uintptr_t)e&a); 
printf("address of a: %.16txX\n", (uintptr_t)e&b); 


void (^block)(int) = 人 ^(int i){ 


printf("In block, address of a: %,.16tXxNxn"， (uintptr_t)e&a); 
printf("In block, address of a: %.16txX\n", (uintptr_t)e&b); 


b += a + i,; 
printf("a = %d, b = %d\n", a, b); 
}; 


// 这 里 先 调 次 Block 
block(100 ) 


// 创建 CreateMy0bject 对 象 ， 将 block 引 用 作为 实 参 传递 进去 
struct MyObject *pobj = CreateMyObject(block); 


return pObj; 


Func 函 数 将 返回 一 个 类 型 为 nt (人 ^) (int ) 的 Block3 引 用 对 象 */ 
(^Func(int a))(int) 


block int c =a+1; 


// 声明 一 个 Block 的 引用 对 象 block， 并 将 它 指向 一 个 jnt (人 ^) (int ) 类 型 的 Block 实 现 
int (^block)(int) = 人 ^int(int 工 ) { 

CG 二 二 十; 

return c; 


}; 


// 各 位 必须 注意 的 是 ， 如 果 一 个 函数 要 把 它 内 部 的 一 个 Block 对 象 引用 传递 出 去 ， 
// 则 必须 使 用 BlLock_copy， 和 否则 在 外 部 再 调用 Block_copy 则 已 经 晚 了 ， 

// 运行 时 可 能 会 发 生 异 常 

return Block _copy(block); 


main(int argc, const char * argv[]) 
struct MyObject *pobj = Test(); 


// 在 main 画 数 中 调用 了 block 引 我 们 发 现 此 Block 中 的 a 和 b 的 值 都 被 完整 地 保留 
// 此 外 ， 人 
// 因为 它 所 在 的 执行 上 下 文 从 Test 画 数 的 栈 空间 被 移入 了 动态 分 配 的 存储 空间 
pobj ->block(pobj->a)， 


// 我 们 再 次 调用 Test 范 数 ， 我 们 发 现 第 二 次 进入 Test 后 ， 
// 其 中 Block 的 0 函数 调用 的 执行 环境 再 做 安排 ， 
// 然后 再 通过 动态 分 配 的 存储 空间 ， 拷 贝 到 pobj2 的 block 成 员 上 
struct MyObject *pobj2 = ee 


// 我 们 可 以 再 调用 一 次 再 观察 情况 ，Block 中 b 的 值 仍然 安全 地 维护 
pObj->block(pObj2->a); 


加 


UD 


// 我 们 再 调用 p0bj2 的 block 
pObj2->block(5); 


DestroyMyObject (pObj); 
DestroyMyObject (pObj2); 


// 调用 Func 画 数 
int (A^refBlock) (int) = Func(10); 


// 通过 Func 玉 数 所 返回 的 Block 引 用 调用 该 Block 
int value = refBlock(3); 
printf("value = %d\n"，value); // 这 里 输出 : value = 14 


// 我 们 可 以 再 调用 一 次 
Value = refBlock(2); 
printf("value = %d\n"，value); // 这 里 输出 : value = 16 


// 由 于 这 蛙 的 refBlock 是 通过 Func 函 数 最 后 的 Block_copy 得 到 的 ， 
// 所 以 用 完 之 后 ， 我 们 要 使 用 Block_release 将 它 释放 
Block_release(refBlock); 


代码 清单 18-5 提 供 了 很 多 信息 。 首 先 ， 我 们 可 以 看 到 在 做 
Block_copy 之 前 Block 里 与 外 部 函数 绑 定 的 对 象 的 地 址 ， 然 后 在 
Block_copy 操 作 之 后 这 些 对 象 地 址 的 变化 。 然 后 ， 我 们 还 能 看 到 如 何 使 
用 Block_copy 与 Block_release 做 Block 引 用 的 拷贝 与 释放 ， 并 且 在 
Block_copy 操 作 之 后 ， 原 先 函 数 中 Block 内 部 绑 定 对 象 的 值 都 完好 地 保 
存 着 。Block 执 行 环境 在 内 部 会 有 引用 转移 机 制 ， 也 就 是 说 ， 当 Block 所 
在 的 函数 即将 返回 时 ， 它 会 将 所 绑 定 的 _block 对 象 解除 引用 ， 使 得 该 
Block 内 的 名 字 绑 定 对 象 指 向 自己 执行 环境 中 的 某 个 存储 空间 ， 并 将 那 
时 刻 的 _block 对 象 的 值 捞 贝 到 那个 存储 空间 中 。 这 样 ， 等 函数 返回 之 
后 ， 无 论 怎 么 调用 此 Block， 访 问 用 _block 所 修饰 的 名 字 绑 定 对 象 都 访 
问 同一 个 执行 环境 中 的 存储 空间 ， 而 不 会 再 受 函 数 栈 空间 的 影响 。 


最 后 ， 我 们 还 获悉 如 果 一 个 函数 要 返回 它 里 面 所 定义 的 一 个 Block 
对 象 引 用 ， 那 么 将 该 Block 引 用 返回 之 前 必须 通过 Block_copy 操 作 。 如 
果 不 在 此 画 数 里 使 用 Block_copy 操 作 ， 而 是 在 外 部 该 函数 调用 结束 之 后 
再 使 用 Block_copy 操 作 ， 那 么 执行 可 能 就 会 引发 异常 。 此 外 ， 即 便 在 函 
数 返回 之 后 立即 调用 Block_copy 操 作 也 不 行 ， 因 为 Block 的 执行 上 下 文 
在 做 Block_copy 操 作 之 前 都 是 与 该 函数 的 栈 空间 所 共享 的 ， 一 旦 函数 返 
回 ， 则 栈 内 会 发 生 一 定 变 化 从 而 可 能 直接 或 间接 地 对 Block 的 执行 环境 
造成 破坏 。 


Block 除 了 可 以 定义 在 函数 内 之 外 还 能 定义 在 文件 作用 域 。 当 然 ， 
如 果 一 个 Block 实 现 定义 在 文件 作用 域 ， 那 么 它 其 实 就 跟 普 通 函 数 差 不 
多 了 ， 因 为 它 也 不 需要 绑 定 任何 局 部 对 象 ， 它 的 栈 空 间 本 吴 就 是 独立 
的 。 我 们 还 可 以 在 其 他 语句 块 内 定义 一 个 Block， 但 需要 注意 的 是 ，C 
语言 标准 已 经 明确 指出 ， 当 一 个 语句 块 中 的 局 部 对 象 出 了 这 个 语句 块 
作用 域 ， 那么 它 的 生命 周期 也 就 到 头 了 ， 即 便 在 有 的 时 候 通 过 指针 来 
间接 访问 这 些 对 象 可 能 会 好 使 。 不 过 我 们 还 是 要 注意 ， 在 语句 块 中 定 
义 的 Block 如 采 要 出 了 该 语句 块 之 后 对 它 调用 的 话 还 是 应 当 移 调用 
Block_copy。 最 后 提醒 大 家 的 是 ， 在 Block 中 不 能 绑 定 一 个 数组 对 象 。 
如 果 我 们 要 把 一 个 数组 对 象 传 递 到 一 个 Block 中 可 以 通过 参数 传递 的 方 
式 ， 或 是 通过 用 一 个 结构 体 来 封装。 代码 清单 18-6 展 示 了 以 上 这 些 
Block 使 用 上 的 特性 。 


代码 清单 18-6 ”Blocks 语 法 的 其 他 使 用 细节 


#include <stdio.h> 
#include <Block.h> 
#include <string.h> 


static int s_array[] = { 1, 2, 3 }; 


// 这 里 声明 了 一 个 返回 类 型 为 int(* ) [3] ， 无 参数 列表 的 Block 引 用 对 象 nyBlock， 
// 接 在 文件 作用 域 实现 了 该 Block 
static int (*(^myBlock)(void))[3] = ^int(*(void))[3] { 
return &s_array; 
}; 


int main(int argc, const char * argv[]) 


// 对 于 类 型 比较 复杂 的 Block 引 用 ， 我 们 可 以 直接 用 _ auto_type， 非 常 简 便 
auto_type block = myBlock; 


// 我 们 通过 main 画 数 中 声明 的 Block 引 用 对 象 block 来 调用 此 block 
int (*pArr)[3] = block(); 


// 声明 array 数 组 对 象 
int array[] = { pArr[0][0], pArr[O][1i], pArr[0][2] }; 


// 在 Block 中 无 法 直接 绑 定 外 部 丽 数 的 局 部 数组 对 象 ， 因 此 这 里 直接 通过 结构 体 来 封装 


struct { int arr[3]; } s; 
// 将 数组 array 的 数据 拷贝 到 s 对 象 中 


memcpy(&s, array, sizeof(array)); 


py 


void (^block2)(void) = NULL; 
if(array[0] > 0) 


block2 = 人 ^{ 
int sum = 0; 
for(int i = 0; i < sizeof(s.arr) / sizeof(s.arr[0]); 
i++) 
sum += Ss.arr[i]; 


printf("The sum is: %d\n", sum); 


// 当然 ,我 们 可 以 在 Block 中 直接 访问 指向 数组 的 指针 对 象 
sum = 0; 
for(int i = 0; i < 3; i++) 
sum += (*pArr)[i]; 
printf("The second sum is: %d\n", sum); 


}; 
// 我 们 在 这 里 通过 block2 调 用 if 语 句 块 中 定义 的 Block 没 有 问题 
block2( ); 


// 但 是 一 旦 我 们 需要 在 if 语 句 块 作用 域外 调用 block2， 则 必须 用 Block_copy 
block2 = Block_copy(block2); 


} 

if(block2 != NULL) 
block2( ); 
// 用 完 之 后 释放 


风 
Block_release(block2); 


在 了 解 了 Blocks 语 法 之 后 ， 下 面 将 给 大 家 呈现 如 何 通 过 Grand 
Central Dispatch 利 用 多 核 多 线程 来 对 一 个 数组 做 求 和 计算 。 先 看 代码 清 
单 18-7。 


代码 清单 18-7 通过 Grand Central Dispatch 做 多 核 多 线程 并 行 求 和 
计算 


#include <stdio.h> 
#include <stdbool.h> 
#include <stdatomic.h> 


#include <dispatch/dispatch.h> 
static int s_buffer[5][10000]; 


int main(int argc, const char * argv[]) 


{ 


// 对 s_buffer 进 行 初始 化 
for(int i = 0; i < 5; i++) 


for(int j = 0; j < 10000; j++) 
s_buffer[i][j] = 10000 * i + j; 
} 


// 声明 用 于 做 并 行 计算 的 行 索引 
_ block volatile atomic_int rowIndex 


// 声明 用 于 最 后 计算 的 结果 

_ block volatile atomic int result ， 

// 通用 标识 用 户 线程 的 计算 全 部 完成 

”block volatile bool isCompleted = false,; 


// 先 对 行 索引 初始 化 为 9 
atomic_init(&rowIndex, 0); 


// 对 计算 结果 初始 化 为 9 
atomic_ init(&result, 0); 


// 定义 计算 Block 

void (^computeBlock)(void) = ^ 苹 
// 确定 当前 要 计算 的 行 
Int row; 


while(row = atomic_fetch_add(&rowIndex，1)，row < 5) 


in 
int sum = 0) 
for(int i = 0; i < 10000; i++) 
sum += Ss_buffer[row][i]; 
// 将 当前 计算 结果 与 result 值 相 加 
atomic_ fetch add(&result, sum); 
} 


}; 


// 线程 分 派 执 行 计算 Block 
dispatch_async(dispatch_get_global_queue(QOS CLASS_ USER_INTERACTIVE, 
90) 
和 ^{ computeBlock(); iscompleted = true; }); 


// 在 主线 程 上 执行 计算 Block 
computeBlock(); 


// 如 果 用 户 线程 没有 执行 完成 ， 则 一 直 等 待 
while( !isCompleted) 
asm("pause" ); 


printf("The result is: %d\n", atomic load(&result)); 


// 我 们 下 面 用 单线 程 传统 算法 计算 ， 校 验 结果 
int sum = 0; 
for(int i = 0; i < 5; i++) 


for(int j = 0; j < 10000; j++) 
sum += s_buffer[i][j]; 


printf("sum = %d\n", sum); 


如 果 我 们 在 Linux 下 编译 运行 代码 清单 18-7 的 话 ， 则 需要 连接 
libdispatch 库 ， 可 以 用 -ldispatch 命 令 选 项 。 


下 面 我 们 来 分 析 一 下 代码 清单 18-7。 首 先 ， 我 们 在 文件 作用 域 声明 
了 一 个 s_buffer 数 组 对 象 ， 它 可 以 看 作 具 有 5 行 10000 列 int 类 型 元 素 的 二 
维 数 组 。 我 们 要 做 的 事情 就 是 利用 双核 双 线 程 对 这 个 数组 中 所 有 元 素 
进行 求 和 。 这 里 所 采用 的 方法 其 实 也 比较 简单 ， 每 个 线程 都 做 同样 的 
操作 ， 即 先 获取 当前 它 要 操作 的 某 一 行 元 素 的 索引 ， 然 后 对 该 行 元 素 
做 求 和 计算 ， 最 后 把 得 到 的 求 和 结果 与 总 的 结果 进行 相 加 。 


main 函 数 中 ， 一 开始 先 对 s_buffer 数 组 所 有 元 素 进行 初始 化 。 然 后 
声明 用 于 并 行 计算 的 当前 行 索引 以 及 结果 ， 这 两 个 必须 是 原子 对 象 ， 
因为 它们 是 两 个 线程 所 共享 的 对 象 ， 并 且 都 会 在 这 些 线程 中 进行 修 
改 。isCompleted 对 象 仅仅 在 用 户 线程 中 进行 写 ， 而 在 主线 程 中 进行 
读 ， 因 此 这 里 不 需要 使 用 原子 对 象 。 


在 Block 中 的 计算 过 程 也 不 复杂 ， 先 用 原子 加 法 对 rowIndex 对 象 做 
加 1 操作 ， 由 于 它 返回 的 正好 是 修改 之 前 的 值 ， 所 以 处 理 起 来 很 方便 ， 
直接 用 当前 得 到 的 行 索引 值 进行 判定 ， 如 条 小 于 5 则 做 求 和 计算 ， 否 则 
退出 循环 。 对 于 当前 行 数 组 每 个 元 聚 的 求 和 不 要 使 用 原子 操作 ， 因 为 
原子 操作 非常 缓慢 ， 会 使 得 多 核 多 线程 性 能 还 远 不 如 单线 程 的 性 能 ， 


所 以 我 们 仅仅 把 当前 行 元 到 获得 的 求 和 结 末 与 已 和 结 末 做 一 次 原 了 于 加 
法 操作 即 可 。 


dispatch_async 函 数 束 是 Grand Central Dispatch 中 用 于 异步 创建 用 户 
线程 并 分 派 执行 的 接口 。 第 一 个 参数 是 指定 当前 用 户 线程 的 优先 级 ， 
其 中 QOS_CLASS_USER_INTERACTIVE 是 最 高 优先 级 ， 


QOS_CLASS_BACKGROUND 是 最 低 优先 级 。 第 二 个 参数 总 是 传 0， 现 
在 还 没有 任何 作用 ， 留 在 以 后 作为 扩展 使 用 。 第 三 个 参数 则 是 void 

(^) ” (void) 类 型 的 Block 引 用 。 我 们 在 这 里 又 创建 了 一 个 新 的 
Block， 因 为 对 于 用 户 线程 ， 我 们 需要 它 告知 主线 程 当前 计算 任务 是 否 
已 经 执行 完成 ， 我 们 在 这 里 也 能 看 到 ， 一 个 Block 中 也 可 以 舱 套 调用 其 
他 Block。 下 面 天 是 在 主线 程 上 直接 调用 computeBlock 进 行 计 算 ， 然 后 
等 待 用 户 线程 计算 结束 后 获取 最 终结 果 。asm (“pause”) ; 是 使 用 x86 
处 理 器 的 PAUSE 指 令 ， 用 来 指示 处 理 器 当前 线程 正 处 于 循环 等 待 ， 可 
以 使 用 超 线程 等 硬件 线程 技术 切换 给 其 他 线程 执行 。 如 果 各 位 将 上 壕 
代码 运行 在 ARMV7 或 ARMV8 架 构 的 处 理 器 上 ， 那 么 可 以 使 用 asm 

("yield") ; ,效果 一 样 。 


18.5 ”本章 小 结 


本 章 介 绍 了 Clang 编 译 器 在 GCC 所 支持 的 GNU 语 法 扩展 上 自己 又 
新 增 的 一 些 语 法 特性 。 本 章 着 重 介 绍 了 Blocks 语 法 的 使 用 ， 大 家 如 果 


能 掌握 好 这 个 语法 那 公 有 用 武之 地 ， 因 为 OpenCL 2.0 也 已 经 引入 了 
Blocks 语 法 特性 作为 其 Lambda 表 达 式 ， 可 用 于 管道 异步 操作 。 而 对 于 


iOS、macOS 的 开发 者 来 说 学 会 Blocks 语 法 就 显得 更 为 重要 了 ， 因 为 


Apple Cooca Framework 现 在 很 多 接口 都 含有 Blocks， 很 多 消息 接口 都 
是 以 Block 引 用 的 方式 作为 回调 参数 的 。 


至 此 ， 本 书 的 内 容 训 接近 尾声 了 。 下 面 将 畅想 一 下 C 语 言 标准 的 
现在 与 未 来 ， 布 望 能 从 中 给 广大 C 语 言 编 程 爱好 者 对 C 语 言 的 设计 以 及 
理念 市 来 更 多 局 迪 。 


第 19 章 ”对 C 语 言 的 未 来 展望 


我 们 到 目前 为 止 已 经 把 所 有 C11 编 程 语言 所 包含 的 语法 特性 都 讲 
述 完 了 。 本 章 我 们 将 主要 根据 当前 C 语 言 标准 委员 会 的 WG14 工 作 小 组 
对 下 一 个 C 语 言 标准 一 一 目前 内 部 定 为 C2X 已 经 做 的 工作 成 果 来 展望 
一 下 洒 来 * 


目 完 ，C 语 言 标准 委员 会 已 经 非常 明确 了 ，C 语 言 在 未 来 不 会 增加 
面向 对 象 的 特性 。 因 为 当前 基于 C 语 言 的 带 有 面向 特性 的 编程 语言 
经 很 多 了 ， 典 型 的 有 大 部 分 兼容 C 语 言语 法 的 C++ 编 程 语言 ， 基 于 C 语 
言 编译 絮 本 映 ， 然 后 仅 提 供 一 个 预 编 译 絮 的 Objective-C。 Objective-C 
与 C 语 言 完全 兼容 ， 甚 至 共用 同一 个 C 编 译 器 。 它 先 将 一 些 Objective-C 
中 的 语法 标签 翻译 为 相应 的 C 函 数 调用 ， 然 后 通过 C 语 言 编译 侣 进行 编 
译 ， 然 后 与 自身 的 运行 时 库 进行 连接 生成 最 终 的 可 执行 程序 。 因 此 目 
前 编程 语言 的 市 场 反 而 是 基于 面向 对 象 的 编程 语言 比 仅 面向 过 程 的 要 
多 ， 而 C 语 言 独善其身 ， 不 受 面向 对 象 语法 特性 的 影响 : 一 方面 能 维 
寺 其 纯粹 性 ， 使 得 它 能 适用 于 更 广泛 的 运行 生产 环境 ， 因 而 也 能 长 期 
成 为 工业 标准 化 的 编程 语言 ， 另 一 方面 ， 这 也 能 保持 C 语 言 可 预见 的 
内 存 模型 ， 我 们 可 以 很 容易 地 判断 一 个 结构 体 中 成 员 如 何 编排 、 占 用 
多 少 存储 空间 等 ， 这 在 其 他 面向 对 象 的 编程 语言 中 是 很 难 ， 甚 至 是 无 


法 做 到 的 。 而 且 这 也 使 得 C 语 言 能 更 好 地 与 汇编 语言 相 结 合 ， 解 决 侦 
回 撒 层 硬件 系统 的 问题 。 


其 次 ，C 语 言 在 语法 体系 上 的 进化 步伐 不 会 迈 得 太 大 。C 语 言 标准 
委员 会 也 在 尽量 控制 C 语 言语 法 体系 的 膨胀 度 。 如 果 一 门 编程 语言 
过 膨胀 则 会 导致 编译 器 项 目 将 难以 维护 ， 并 且 会 引发 各 种 Bug， 其 实 
这 一 点 在 C++ 编程 语言 上 体现 得 十 分 明显 。 现 在 主流 编译 器 都 能 文 持 
到 C++14 标 准 ， 但 关于 这 些 C++ 编 译 器 的 Bug 报 告 也 在 源源 不 断 地 产 
生 。C++17 标 准 还 会 添加 不 少 东 西 ， 对 于 C++ 编程 语言 而 言 ， 它 已 经 
变 得 过 于 腾 肿 。 在 这 一 点 上 ，C 语 言 发 展 的 谨慎 还 是 非常 难得 的 ， 这 
个 时 代 做 减法 反而 更 难能可贵 ， 这 也 是 为 什么 笔者 对 C 语 言 如 此 情 有 
独 钟 的 原因 之 一 。 不 过 C2X 标 准 也 会 将 一 些 比较 好 的 现 有 C++ 特 性 引 
入 进来 ， 后 续 小 节 中 会 有 所 介绍 ， 但 不 会 导致 语法 特性 过 于 庞杂 。 下 
一 个 C 语 言 标准 目前 内 部 称 为 C2X， 说 明 它 将 在 2020~2029 年 之 间 的 
某 个 时 候 发 布 ， 不 过 笔者 估计 在 2020~2022 年 之 间 发 布 的 可 能 性 高 。 


最 后 ， 笔 者 先 大 概 描 述 一 下 目 己 希望 未 来 C 语 言 能 提供 的 一 些 语 
法 特性 ， 然 后 在 以 下 各 节 介 绍 现在 WG14 工 作 小 组 基本 已 经 确定 要 在 
C2X 中 引入 的 语法 特性 。 笔 者 硕 望 C2X 标 准 能 引入 以 下 这 些 语法 特 
性 。 


1) 文 持 半 精度 浮 点 数 : 随 着 3D 图 形 浑 染 以 及 图 像 处 理 的 多 媒体 
应 用 需求 增多 ， 不 少 处 理 喜 开发 商都 已 经 在 目 己 的 处 理 磊 中 引入 了 16 


位 半 精 度 浮 点 数 的 计算 处 理 单 元 。 而 在 2008 年 ，IEEE754 标 准 也 在 8 月 
发 布 了 最 新 浮 点 数 格 式 表达 标准 ， 此 后 文 持 半 精度 浮 点 数 存 储 格式 的 
处 理 絮 的 种 类 吏 更 多 了 。 这 十 分 常见 于 GPU 中 ， 而 当前 基于 Haswell 微 
架构 的 Intel 处 理 器 以 及 基于 支持 VFPv4 ARMv7 架 构 以 及 ARMv8 架 构 的 
ARM 处 理 器 都 文 持 半 精度 浮 点 数 的 存储 。 当 前 GCC 和 Clang 编 译 器 已 
经 通过 GNU 语 法 扩展 引入 了 半 精 度 浮 点 数 类 型 _fp16， 尺 管 现在 大 部 
分 CPU 不 能 直接 对 半 精 度 浮 点 数 做 加 减 乘除 算术 运算 ， 但 是 能 够 在 单 
精度 浮 点 类 型 与 半 精 度 浮 点 类 型 之 间 相 互 转换 。 再 过 几 年 之 后 ， 随 着 
处 理 需 支持 半 精 度 浮 点 的 处 理 能 力 增强 ，C 语 言 标准 也 应 该 增加 对 半 
精度 浮 点 数 的 支持 ! 根据 当前 C 语 言 标准 新 增 关键 字 的 命名 特性 ， 使 
用 _Half 作 为 半 精 度 浮 点 数 的 类 型 标识 符 比较 合适 。 然 后 在 标准 库 中 引 
入 <half.h>， 可 以 将 _Half 宏 定义 为 half 。 


2) 将 GNU 语 法 扩展 中 的 typeof 纳 入 标准 : 萃取 一 个 数据 对 象 的 类 
型 在 很 多 方面 都 会 显得 十 分 方便 ， 而 且 C++11 中 也 引入 了 decltype 天 键 
字 ， 其 作用 与 typeof 十 分 类 似 ， 而 且 还 能 作为 男 数 类 型 推导 使 用 。 
此 C 语 言 标准 在 引入 typeof 上 也 不 会 显得 十 分 困难 ， 毕 竟 GCC 和 Clang 
对 此 关键 字 已 经 用 了 十 多 年 了 。 


3) 类 型 自动 推导 : 很 多 现代 化 编程 语言 都 有 类 型 自动 推导 特性 ， 
比如 2014 年 新 生 的 Swift 编程 语言 ， 还 有 C++11。 类 型 自动 推导 在 一 定 
程度 上 能 省 去 不 少 代码 以 及 一 些 不 必要 的 类 型 转换 ， 配 合 typeof 使 用 


将 威力 无 穷 。 如 果 运 用 在 宏 定义 中 的 话 ， 能 体现 出 无 与 伦比 的 灵活 性 
和 强大 性 能 。 而 这 个 语法 特性 也 在 GCC 4.9 以 及 Clang 3.8 中 通过 引入 
auto type 关键 字 实现 了 。 


4) 引入 Lambda 表 达 式 : Lambda 表 达 式 在 并 行 计 算 上 能 发 挥 很 大 
优势 ， 这 一 点 在 Apple 开 源 的 Grand Central Dispatch 中 就 已 经 体现 得 淋 
漓 尽 致 了 。Apple 将 Blocks 语 法 引入 到 Clang 编 译 器 中 ， 它 工作 良好 ， 
不 仅 能 起 到 简化 代码 的 作用 ， 而 且 还 能 提升 并 行 计算 的 性 能 。 因 此 笔 
者 这 里 希望 C2X 中 能 引入 Blocks 语 法 或 者 类 似 的 Lambda 表 达 式 。 


下 面 我 们 将 挑选 几 条 比较 有 意思 的 WG14 工 作 小 组 基本 已 经 确定 
要 在 C2X 中 引入 的 语法 特性 。 


19.1 C 语 言 中 的 属性 


当前 C 语 言 标准 中 是 没有 “属性 ”这 个 语法 特性 的 。 其 中 ， 我 们 第 
用 的 像 字 节 对 齐 这 类 属性 已 经 转 为 相应 的 关键 字 _Aligno 人 与 _Alignas 作 
为 类 型 限定 符 使 用 。 而 如 果 要 搬 述 一 个 对 象 、 芳 数 或 类 型 的 其 他 属性 
只 能 借助 编译 器 各 自 的 实现 定义 。 比 如 在 MSVC 中 使 用 的 是 _ declspec 
关键 字 来 引出 一 个 属性 ， 在 GCC 与 Clang 编 译 器 中 则 使 用 _attribute__ 
天 键 字 来 引出 一 个 属性 。 


C++11 标 准 已 经 通过 [[< 属 性 表达 式 >]] 这 一 语法 特性 来 描述 一 个 函 
数 、 对 象 或 类 型 的 属性 。 而 这 次 C 语 言 标准 委员 会 也 想 借助 这 种 表示 
法 来 描述 属性 。 这 样 ， 以 后 我 们 要 使 用 属性 时 就 不 需要 根据 不 同 编译 
器 来 使 用 _declspec 或 attribute _ 了， 而 直接 使 用 [[]] 即 可 。 


代码 清单 19-1 将 展示 [[]] 属 性 表达 式 的 使 用 方式 以 及 效果 。 
代码 清单 19-1 ”C2X 的 属性 


#include <stdio.h> 
// 定义 一 个 总 是 被 编译 器 内 联 的 函数 


static int [[ always_inline ]] foo(int a, int b) 


return a + b; 


int main(int argc, const char * argv[]) 


// 下 We 
int [[ mode(byte) J] a 0; 

// 定义 一 个 以 8 学 节 刘 开 的 结 柯 体 ” 

struct MyStruct { 


Short a, b; 
} [[ aligned(8) 1]]; 


代码 清单 19-1 中 可 以 看 到 ， 使 用 [中 属性 的 方式 与 _attribute_ 很 类 
似 ， 而 且 择 放 位 置 也 差不多 一 样 ， 但 在 表达 上 则 更 为 简洁 。 


19.2 fallthrough 必 性 


我 们 平时 在 写 switch-case 语 句 的 时 候 ， 一 般 情况 下 每 条 case 语 句 结 
尾 处 都 会 使 用 一 个 break 或 是 return 来 跳出 该 选择 分 支 。 但 是 在 有 些 时 
候 ， 我 们 确实 想 在 处 理 完 当 前 case 分 支 之 后 再 直通 (fallthrough) 到 下 
一 条 case 语 句 紧 接着 处 理 。 因 此 原 有 的 C 语 言 束 有 默许 case 语 句 直 通 的 
功能 。 但 是 程序 员 不 是 神仙 ， 如 果 当 我 们 在 编写 程序 中 不 是 有 意 要 让 
当前 case 语 句 直通 ， 而 是 漏 加 了 一 条 break 语 句 ， 那 么 程序 就 可 能 会 发 
生意 想不到 的 情况 。 而 且 在 这 种 情况 下 ， 由 于 编译 器 也 缺乏 足够 的 条 
件 来 判定 程序 员 是 漏 加 了 break 语 句 还 是 故意 想 让 case 语 句 直 通 ， 所 以 
也 不 会 给 出 任何 提示 。 因 此 C++17 标 准 引 入 了 [[fallthrough]] 属 性 显 式 
地 提示 当前 case 语 句 需要 直通 到 下 一 条 case， 这 样 一 来 编译 需 能 够 判断 
出 当前 程序 员 是 否 漏 加 了 break 还 是 有 意 让 case 语 句 直 通 。 而 这 个 属性 
也 将 在 C2X 标 准 中 被 采纳 。 


[[fallthrough]] 这 个 属性 与 其 他 属性 有 些 不 同 ， 它 不 作为 对 象 、 画 
数 、 类 型 的 限定 符 的 样式 进行 使 用 ， 而 是 类 似 于 一 条 语句 ， 惑 像 break 
语句 那样 。 标 准 中 也 提 到 了 ，[[fallthrough]] 只 能 用 在 case 语 句 中 ， 并 且 
只 能 放 在 下 一 条 case 语 句 的 上 面 。 倘 阁 两 条 case 语 句 之 间 没 有 任何 语 
句 ， 那 么 可 以 不 用 [[fallthrough]];， 不 然 必须 用 [[fallthrough]] 显 式 指 明 


当前 case 语 句 直 通 到 下 一 条 case 语 句 ， 不 然 编译 器 应 该 报 出 警告 。 代 码 
清单 19-2 将 描述 的 [[fallthrough]] 属 性 的 大 致 用 法 。 


代码 清单 19-2 [[fallthrough]] 属 性 的 大 致 用 法 


#include <stdio.h> 


int main(void) 


int n = 1; 
switch (n) 
case 0: 
// 由 于 case 0 与 case 1 之 间 没 有 任何 表达 式 ， 所 以 这 里 不 需要 使 用 [[fallthrough]] 
case 1: 
++n 
[Tfallthrough]]， // 这 里 通过 [[fallthrough]] 进 行 直 i 


case 2: 
n *= 2) 
// 由 于 case 2 下 面 含 有 一 条 case 标 签 语 句 ， 但 没有 出 现 [[fallthrough] ] ， 
// 而 采用 的 是 隐 式 直通 ， 所 以 编译 器 这 里 应 该 给 出 警告 
Case 3 
Nn--, 
// 这 里 通过 执行 break 语 句 而 跳出 了 此 switch 选 择 语 句 块 ， 
// 所 以 前 面 的 [[fallthrough]] 都 只 能 直通 到 这 
break; 
default: 


为 通过 直通 执行 到 case 3 条 件 


n = 0; // 这 里 的 default 分 支 不 会 被 执行 ， 


大 
// 这 里 使 用 [[fallthrough]] 编 译 器 会 发 出 警告 ， 因 为 后 续 没 有 case 标 签 了 
[[fallthrough]]; 


// 这 里 输出 : n = 3 
printf("n = xdNnn ， n); 


代码 清单 19-2 中 列 出 了 [[fallthrough]] 属 性 的 基本 使 用 方式 以 及 一 
些 约束 限制 。 这 里 ，n 的 值 满足 case 1， 然 后 做 完 ++n 操 作 之 后 通过 
[[fallthrough]] 直 通 到 case 2 继续 做 n*=2 操 作 。case 2 条 件 分 支 的 最 后 使 
用 了 当前 C 语 言 的 默认 直通 方式 ， 这 会 引发 C2X 编 译 硕 的 警告 ， 不 过 
这 也 能 成 功 地 直通 到 case 3 语句 的 处 理 。case 3 分 文通 过 break 语 句 跳出 


当前 switch 语 句 块 。 因 此 n 对 象 经 过 了 上 述 除 了 default 之 外 的 所 有 case 
语句 的 处 理 执行 ， 结 果 为 3。 


19.3 ”数组 片段 


数组 片段 这 个 语法 特性 的 灵感 来 源 于 比 C 语 言 更 上 古老 的 Fortran 编 
程 语言 。C2X 标 准 增加 数组 片段 特性 其 实 不 仅仅 古 为 了 加 入 一 些 语法 
糖 ， 使 得 数组 操作 更 为 灵活 、 方 便 ， 而 主要 是 为 了 激发 当前 现代 化 时 
面 处 理 器 以 及 智能 移动 处 理 器 的 多 线程 与 SIMD ( 单 指令 多 数据 ) 指令 
集 的 威力 。 


数组 片段 的 语法 其 实 非 第 简单 : 


< 数组 对 象 标识 符 > [ < 起 始 元 素 下 标 索 引 表 达 式 > : < 长 度 表 达 式 > : < 跨度 表达 式 > ] 


这 里 ，< 起 始 元 素 下 标 索 引 表 达 式 > 指明 了 所 要 获取 数组 片段 的 首 
个 元 素 的 索引 位 置 ，< 长 度 表 达 式 > 指明 了 所 要 获取 数组 片段 的 元 素 个 
数 ;< 跨度 表达 式 > 指明 了 从 当前 元 素 茶 取 完 之 后 跨 多 少 个 元 素 再 茶 取 
一 次 。 这 里 ，< 跨 度 表 达 式 > 可 省 ， 如 果 缺 省 ， 那 么 跨度 默认 为 1。 我 
们 现在 举 一 个 比较 简单 的 例子 ， 假 设 我 们 声明 了 一 个 数组 对 象 A， 那 
么 A[1: 3: 2] 表 示 茜 取 一 个 数组 片段 ， 该 数组 片段 的 起 始 元 素 为 
A[1]， 一 共有 3 个 元 素 ， 然 后 每 跨 两 个 元 素 取 一 次 ， 所 以 最 终 该 数组 片 
段 的 元 素 依 次 为 A[1]，A[3]，A[5]。 而 像 A[0: 3] 则 表示 所 蔡 取 的 数组 
片段 起 始 元 素 为 A[0]， 长 度 为 3， 跨 度 为 1， 所 以 茜 取 后 的 数组 片段 元 


素 依 次 为 AL0]，A[I1，A[2]。 而 如 条 是 A[: ]， 则 表示 以 数组 A 的 所 有 
元 素 作 为 数组 卢 段 的 元 素 。 


从 以 上 操作 可 以 看 到 ， 数 组 片段 类 似 于 取 一 个 数组 的 子 数组 ， 不 
各 位 需要 注意 的 是 ， 数 组 片段 一 般 痢 十 与 数组 片段 进行 操作 ， 也 就 
说 等 号 的 天 表达 式 与 右 表 达 式 都 应 该 是 一 个 数组 片段 。 而 在 C 语 言 
和 类 型 体系 上 ， 数 组 请 段 其 实 是 不 具备 类 型 的 ， 因 为 数组 片段 操作 的 
本 质 是 将 右 表 达 式 数组 循环 < 长 度 表 达 式 > 次 ， 然 后 按照 指定 模式 进行 
操作 ， 最 后 将 结果 存 入 左 表 达 式 的 数组 中 。 所 以 说 数组 片段 的 实际 实 
现 会 根据 当前 情况 使 用 循环 迭代 拆 分 成 一 个 个 单独 的 标量 操作 ， 或 是 
利用 当前 硬件 特性 直接 通过 多 线程 或 SIMD 的 操作 来 实现 。 


一 


岂 


Pf 


IT 


下 面 我 们 将 通过 3 节 内 容 依 次 描述 数组 片段 的 赋值 操作 、 算 术 计 算 
操作 以 及 函数 调用 的 场合 。 


19.3.1 数组 请 段 的 赋值 操作 


正 因 为 数组 片段 引入 到 C2X 标 准 的 主要 原因 是 充分 利用 便 件 特 
性 ， 发 挥 多 线程 与 SIMD 指 令 集 的 性 能 ， 所 以 在 对 数组 片段 的 赋值 操作 
时 ， 倘 者 左右 表达 式 都 症 同一 个 数组 对 象 ， 那 么 两 者 最 后 产生 的 数组 
片段 的 元 素 位 置 不 应 该 存在 “不 完全 从 交 ”的 情况 。 因 为 这 会 产生 元 素 


依赖 而 破坏 多 线程 以 及 SIMD 的 独立 操作 。 代 码 清 单 19-3 将 描述 数组 片 
段 的 赋值 操作 。 


代码 请 单 19-3 ”数组 放 段 的 赋值 操作 


#include <stdio.h> 
#include <intrin.h> 


typedef _ m128i int4; 
int main(void) 


// 声明 一 个 int [19] 类 型 的 数组 对 象 a， 对 它 进 行 初始 化 
int a[] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }; 


// 声明 一 个 ijnt[10] 类 型 的 数组 对 象 b 
int b[sizeof(a) / sizeof(a[0])]; 


// 0 从 数组 b 的 前 三 个 元 素 
b[9:3] = a[7:3 


A/ 以 上 操作 即 类 似 于 : 
for (int i = 0; i < 3; i++) 
b[0 + i] = a[7 + i]; 


// 这 条 语句 是 将 数组 a 的 全 部 元 素 赋值 给 数组 b 
b[:] = a[l:]; 


// 上 述 操作 即 类 似 于 ; 
for (int i = 0; i < 10; i++) 
b[i] = a[il]; 


// 这 条 语句 是 将 数组 a 从 起 始 元 素 开始 ， 跨 3 个 元 素 ， 取 3 次 元 素 赋值 给 数组 b; 
// 对 数组 b 的 存放 则 是 从 第 1 个 元 素 入 每 跨 2 个 元 素 存放 一 次 ， 一 共存 放 3 次 
b[1:3:2] = a[0:3:3]; 


A/ 以 上 操作 即 类 似 于 : 
for (int i = 0; i < 3; i++) 
b[1 + i* 2] = a[l0+1i* 3]; 


// 以 下 语句 会 产生 未 定义 行为 ， 因 为 左 表达 式 的 数组 片段 长 度 
// 与 右 表 达 式 的 数组 片段 长 度 不 一 至 
b[0:3] = a[5:4]; 


| 


// 这 条 语句 是 合法 的 ， 将 数组 a 的 后 5 个 元 素 赋值 给 前 5 个 元 素 。 
// 这 里 对 数组 a 的 操作 没 有 元 素 舍 交 
a[0:5] = a[5:5]; 


// 这 条 语句 也 是 合法 的 ， 将 数组 a 的 所 有 元 过 做 -次 赋值 ， 
// 这 种 情况 属 了 对 同 个 数组 操作 时 ， 元 素 全 部 看 交 的 场合 


// 这 条 语句 会 产生 未 定义 行为 ， 因 为 在 操作 过 程 中 ， 
// 数组 元 素 从 a[2] 到 a[9] 均 是 肝 交 元 素 ， 明 于 部 分 有 至 交 
a[1:8] = a[2:8]; 
// 部 分 受 交 为 何不 允许 发 生 在 数组 片段 呢 ? 


// 因为 通过 多 线程 或 SIMD 的 操作 会 同时 诅 取 数组 1a 的 相关 元 素 ， 
// 然后 一 次 性 以 向 量 的 方式 存放 到 左 表达 式 数 组 片段 指定 位 置 。 
// 倘若 存在 琶 交 情况 ， 那 么 会 出 现 不 可 期 待 的 结果 。 

// 假设 我 们 现在 处 理 器 文 持 SSE2， 那 么 存在 一 个 类 型 Int4， 
// 上 上 述 操作 将 可 能 是 这 么 实现 的 : 

for (int i = 0; i < 2; i++) 


贱 


// 从 a[2 + 4 * 于] 元 素 的 地 址 处 一 次 读 取 4 个 元 素 ， 存 放 到 value 中 
int4 value = mm Joadu si128((int4*)&a[2 + 4 * 1i]); 


// 将 value 存 放 到 a[1 + 4 * 二 ] 元 素 地 址 处 
mm_storeu_si128((int4*)&a[1 + 4 * i], value); 


// 这 里 就 会 引发 一 个 问题 ， 第 a 
// a[1] 到 a[4] 的 原本 元 素 值 就 被 改变 
// 第 二 次 迭代 将 a[6] 到 a[9] 元 素 在 放 到 a[s] 到 a[8] 之 后 
// a[5] 到 a[8] 原 本 元 素 的 但 就 
// 在 多 线程 情况 下 ， 这 两 次 操 的 砚 字 是 不 而 定 的 下 执行 
// 与 么 稍 后 做 的 第 一 组 潍 代 中 ， a[5] 元 素 的 值 就 不 是 原本 的 值 ， 而 


/xx 下 面 我 们 可 以 再 看 1 数组 的 数组 片段 赋值 */ 
int c[5][5] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 0 }; 
int d[5][5]; 


// 这 里 我 们 完成 了 一 次 向 量 转 置 操作 ， 
// 将 数组 二 维 数组 c 的 第 一 行 元 素 赋值 给 了 数组 d 的 第 一 列 元 素 
d[9:5][9] = c[90][90:5]; 


代码 清单 19-3 详 细 介 绍 了 数组 片段 赋值 的 方法 、 效 果 以 及 约束 。 


19.3.2 ”数组 请 段 的 算术 计算 操作 


数组 片段 的 算术 操作 与 普通 的 标量 计算 类 似 ， 并 且 这 里 的 乘法 操 
作 也 是 对 数组 片段 的 每 个 元 素 进 行 乘法 操作 ， 而 不 是 作为 癌 量 内 积 ， 
也 不 作为 矩阵 乘法 操作 。 代 码 清单 19-4 列 出 了 数组 片段 的 算术 计算 操 
作 的 用 法 与 效果 。 


代码 清单 19-4 数组 片段 的 算术 计算 操作 


#include <stdio.h> 
int main(void) 


// 声明 一 个 数组 对 象 a， 它 含有 10 个 元 素 
int a[] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }; 


// 声明 一 个 数组 对 象 b， 它 也 有 10 个 元 素 
int b[10] = { 0 }; 


// 将 数组 b 的 所 有 元 素 赋值 为 1 
bfs] = 二 


// 将 a[2] 元 素 的 值 分 别 与 5D[06]、b[1]、b[2] 相 加 ， 
// 然后 将 结果 存放 到 b[9]、b[1]、b[2] 
b[0:3] += a[2]; 


// 将 数组 b 的 各 个 元 素 与 2 相 乘 ， 然 后 将 结果 存放 到 数组 b 的 各 个 元 素 


// 对 数组 a 的 每 个 元 素 做 递增 操作 


// 声明 一 个 二 维 数组 c 
int CE[5jL5] 三 所 2, 3, 4, 5, 6, 7; 8 9, 9 }; 


// 声明 一 个 二 维 数 组 d 
int d[5][5]; 

// 这 个 没 问题 ， 将 c[0] 的 所 有 元 素 赋值 到 d[0] 中 
d[9][:] = c[9o][:]; 

// 这 条 语句 操作 没有 问题 ， 它 是 定义 良好 的 
d[9:2][9:3] = c[1:2][2:3] + d[2:2][1:3]; 


// 以 上 操作 相当 当 于 : 


for (int i = 0; i < 2; i++) 


for (int j = 0; j < 3; j++) 
d[9o + i][0 + j] = c[1i + i][2 + j] + d[2 + i][1 + j]; 


// 以 下 这 条 语句 的 行为 是 未 定义 的 ， 

// 由 于 取 数 组 a 的 数组 片段 的 维度 与 取 数 组 d 的 数组 片段 的 维度 不 一 致 。 
// 我 们 这 里 需要 注意 的 是 ， 一 个 标量 可 以 给 数组 片段 进行 计算 操作 并 赋值 ， 
// 但 一 个 数组 片段 参与 计算 与 赋值 时 ， 左 右 两 边 的 数组 片段 维度 必须 一 臻 
d[9:2][0:2] = a[0:2]; 


19.3.3 ”数组 斤 段 用 于 函数 调用 的 情况 


在 函数 调用 时 ， 数 组 户 段 用 作画 数 调 用 实 参 的 场合 非常 能 体现 数 
组 片段 的 本 质 特性 以 及 实质 作用 。 这 里 需要 注意 的 征 ， 数 组 片段 用 作 


函数 实 参 时 ， 函 数 形 参 的 类 型 一 般 为 数组 的 元 素 类 型 ， 而 不 是 一 个 指 
向 数组 元 素 指针 类 型 。 代 码 清单 19-5 描 述 了 数组 片段 用 于 函数 调用 时 
的 实 参 传递 情况 。 


代码 清单 19-5 ”数组 片段 用 于 函数 调用 时 的 实 参 传递 情况 


#include <stdio.h> 
// 定义 一 个 函数 MyAdd， 它 的 作用 是 将 两 个 形 参 值 相 加 ， 然 后 将 结果 返 区 
static int MyAdd(int a, int b) 


return a + b; 


int main(void) 


// 声明 一 个 数组 对 象 a， 它 含有 10 个 元 素 
int a[] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }; 


// 声明 一 个 数组 对 象 b， 它 也 有 10 个 元 素 
int bf10] = € 11, 12, 13, 14, 15. }; 


// 对 函数 MyAdd 进 行 逐 步调 用 ， 然 后 将 结果 依次 赋值 给 bp[5] 到 b[9] 元 素 
b[5:5] = MyAdd(a[5:5], b[0:5]); 


// 以 上 操作 相当 于 : 
for (int i = 0; i < 5; i++) 
b[5 + i] = MyAdd(a[5 + i], b[0 + i]); 


19.4 其 他 语法 特性 


除了 上 壕 提 到 一 些 语法 特性 和 属性 之 外 ，WG14 工 作 组 也 基本 确 
定 了 还 会 将 当前 Clang 编 译 属 已 经 实现 了 的 _has_include 加 入 到 C2X 
中 


[© 


此 外 还 新 增 了 [[maybe_unused]] 属 性 ， 这 个 属性 用 于 修饰 声明 的 静 
态 对 象 、 静 态 函 数 以 及 语句 块 作用 域内 声明 的 局 部 对 象 。 如 采 这 些 对 
象 声 明 之 后 没有 人 被 使 用 ， 那 么 编译 侣 往往 会 给 出 警告 但 用 了 这 个 属 
性 之 后 ， 即 便 上 述 声明 的 对 象 或 函数 在 当前 上 下 文中 没有 被 使 用 ， 编 


译 器 也 不 会 发 出 警告 。 


mm 各 


另外 还 有 对 register 天 键 字 想 做 一 些 折 展 ， 比 如 让 它 跟 const 限 定 符 
连用 ， 构 造 一 个 常量 表达 式 。 常 量 表达 式 在 C++11 标 准 中 是 用 
constexpr 限 定 符 来 表示 的 。 有 具体 如 何 实 现 ，WG14 工 作 小 组 仍然 在 研 
究 探 讨 中 。 


19.5 ”本章 小 结 


本 章 对 C 语 言 末 来 的 发 展 做 了 一 些 具 有 前 上 脆性 的 猜想 ， 并 根据 当 
前 WG14 的 工作 情况 做 了 一 些 汇 总 。 不 管 C 语 言 在 5 年 后 变 成 怎样 ， 它 
` 会 一 下 子 变 得 面目 全 非 ， 语 法 体系 上 也 不 会 有 非常 大 幅度 的 修改 ， 
而 是 会 充分 考虑 同 前 兼容 ， 这 一 总 与 C++ 那 种 大 刀 阔 径 的 演化 有 所 不 
同 六 


因此 ， 我 们 可 以 相信 ， 未 来 的 C 语 言 不 会 变 得 难 学 ， 它 仍然 会 是 
一 门 相对 比较 简单 、 高 效 的 高 级 编程 语言 ， 并 且 继 续 作 为 工业 标准 为 
各 个 生产 、 设 计 、 计 算 平台 所 使 用 。 


Re 


C 语 言 所 有 语法 特性 的 介绍 到 此 结束 。 下 面 两 革 将 通过 两 个 不 算 
太 大 但 功能 完整 的 设计 项 目 来 展示 一 下 如 何 用 C 语 言 做 实际 项 目 。 


项 目 实践 篇 
UTF-8 编 码 格式 


Wr 一 
有 ET 


具有 外 部 连接 的 全 局 
函数 的 声明 与 调用 
stdio.h 库 


指向 函数 的 指针 的 使 用 
函数 的 递归 调用 


第 20 章 ”制作 UTF-8 与 UTF-16 编 码 字符 串 
的 转 码 句 


UTF-8 字 符 编 码 格式 与 UTF-16 字 符 编 码 格式 都 是 当今 非常 常用 的 
字符 编码 格式 ， 它 们 都 是 根据 Unicode 这 一 计算 机 工业 编码 标准 进行 制 
定 的 。 当 今 现代 化 计算 机 操作 系统 几乎 都 使 用 UTF-8 作 为 其 默认 的 系 
统 字符 编码 格式 ， 大 部 分 集成 开发 环境 也 几乎 默认 使 用 UTF-8 编 码 格 
式 。Google 在 2008 年 的 报告 中 指出 ， 在 互联 网 上 ，UTF-8 编 码 已 经 成 
为 HTML 文 件 使 用 最 多 的 字符 编码 格式 。 


在 当今 许多 文本 解析 上 ， 大 多 都 以 UTF-16 编 码 来 收集 源 文 件 以 及 
文本 上 的 字符 ， 因 为 UTF-16 编 码 格式 的 可 变性 小 ， 而 且 大 部 分 情况 下 
2 个 字 节 即 可 表示 一 个 常用 字符 ， 因 此 用 UTF-16 编 码 格式 的 字符 串 一 
来 不 怎么 耗费 内 存 ， 二 来 能 方便 地 确定 字符 串 的 长 度 ， 从 而 可 以 方便 
地 进行 插入 、 修 改 、 删 除 等 操作 。 因 此 对 于 字符 串 的 编辑 而 言 ， 它 比 
UTF-8 更 具 优 势 。 


下 面 ， 我 们 将 先 分 别 介绍 UTF-8 编 码 格式 与 UTF-16 编 码 格式 的 相 
关 知 识 ， 然 后 再 具体 介绍 笔者 已 经 实现 的 两 者 之 间 的 转换 工具 以 及 其 
他 操作 工具 。 


20.1 UTF-8 字 符 编码 格式 


UTF-8 字 符 编 码 是 一 种 变 长 的 字符 编码 格式 ， 可 兼容 之 前 已 有 的 
ASCII 编 码 格式 。 它 在 1993 年 1 月 首次 官方 发 布 ， 当 时 UTF-8 编 码 的 字符 
长 度 最 多 可 长 达 6 个 字 节 ， 也 就 是 说 当时 一 个 UTF-8 编 码 的 字符 可 占用 1 
到 6 个 字 节 ， 比 如 如 果 一 个 字符 是 与 ASCII 码 相 兼容 的 ， 那 么 它 就 只 占 1 
个 字 节 。 到 了 2003 年 11 月 ，UTF-8 做 了 一 些 改动 然后 再 次 发 布 ， 这 是 为 
了 让 UTF-8 全 UTF-16 能 完整 兼容 转换 ， 对 UTF-8 的 表达 泥 围 做 了 裁 醒 ， 
将 它 的 最 大 长 度 缩减 到 了 4 个 字 节 ， 并 且 要 求 它 必须 满足 RFC 3629 标 准 
中 的 约束 。 现 在 我 们 用 的 UTF-8 编 码 格 式 都 是 基于 2003 年 发 布 的 标准 实 
现 的 。 


我 们 上 面 探 讨 了 UTF-8 是 一 种 变 长 编码 格式 ， 其 长 度 在 1 个 字 节 到 4 
个 字 节 之 间 ， 那 么 一 个 UTF-8 编 码 的 字符 是 如 何 表达 的 呢 ? 一 个 UTF-8 
编码 的 字符 由 两 部 分 构成 ， 第 一 部 分 是 用 于 标识 该 字符 一 共 需 要 多 少 
字 节 的 前 级 比特 标志 。 这 个 前 级 比特 要 看 第 一 个 字 贡 的 高 5 位 ， 如 果 是 
0， 表 示 当 前 字符 由 1 个 字 廊 构成 ， 如 果 是 3， 表 示 当 前 字符 由 2 个 字 市 
构成 ， 如 果 是 7 表示 当前 字符 由 3 个 字 节 构成 ， 如 果 是 15， 则 表示 当前 
字符 由 4 个 字 节 构成 。 其 实 这 也 束 意 味 着 通过 观察 第 一 个 字 节 的 前 导 1 
的 个 数 即 可 判断 出 当前 字符 由 多 少 个 字 节 构成 。 第 二 部 分 则 是 该 字符 
的 码 点 (code point) 。 所 谓 码 点 就 是 用 于 表示 一 个 特定 字符 具有 实际 


意义 的 编码 值 ， 该 编码 值 是 由 Unicode 组 织 制定 的 。 比 如 对 于 一 个 兼容 
ASCII 码 的 UTF-8 编 码 字 符 A 来 说 ， 其 完整 的 二 进 制 编码 为 01000001。 
可 见 其 前 导 1 的 个 数 为 0， 说 明 它 就 由 1 个 字 节 构成 。 然 后 它 的 码 点 即 为 
1000001， 即 十 六 进 制 的 0x41。 表 20-1 列 出 了 UTF-8 不 同 字 节 数 构成 的 
字符 编码 信息 。 


表 20-1 UTF-8 编 码 信 息 表 


字 节 个 数 | 码 点 比特 个 数 | 起 始 码 点 | 最 后 码 点 字 节 1 字 节 4 


0x0000 0x007F OXXXXXXX N/A 


Ox0080 Ox07FF 110xxxxx 10xxxxxx N/A 


Ox0800 OxFFFF 1110xxxx 10xxxxxx 10xxxxxx N/A 


二 | 中 DI 


0x10000 Ox10FFFF 11110xxx 10XXXXXX 10xxxxxx 1] 0XXXXXX 


表 20-1 中 ，x 符 号 表示 人 码 点 的 一 个 比特 。 我 们 看 到 ， 为 了 与 ASCII 

码 完全 兼容 ，Unicdoe 在 制定 UTF-8 编 码 时 ， 将 没有 任何 前 导 1 的 字 节 表 
示 为 单字 节 UTF-8 编 码 ， 然 后 从 由 2 个 字 节 构成 的 UTF-8 编 码 开 始 ， 有 
多 少 个 前 导 1 束 表明 当前 字符 占用 多 少 个 字 亡 。 然 后 ， 对 于 一 个 字符 的 
UTF-8 编 码 ， 后 续 字 节 的 编码 都 以 10 开 头 ， 这 么 做 的 好 处 是 可 用 于 校 验 
当前 字符 编码 的 正确 性 ， 也 可 以 避免 解析 到 用 于 表示 UTF-8 字 符 串 的 结 
束 符 \0 字 符 ， 因 为 它 的 编码 值 为 0， 而 有 了 前 导 10 比 特 ， 则 当前 字 节 的 
最 小 值 为 0x80， 所 以 不 可 能 会 出 现 0 的 情况 。 这 种 特性 也 称 为 自 同步 

(self-synchronizing) 特性 ， 它 可 在 遍历 UTF-8 编 码 字 符 串 的 时 候 方便 
校 验 当前 字符 编码 的 正确 性 。 


我 们 下 面 举 一 个 具体 例子 来 说 明 一 个 字符 的 UTF-8 编 码 是 如 何 构成 
的 ， 我 们 这 里 用 欧元 符号 € 进 行 举例 说 明 。 


在 Unicode 标 准 中 ， 欧 元 符号 6 的 码 点 为 0x20AC。 那 么 可 以 根据 以 
下 步骤 来 构造 出 其 UTF-8 编 码 。 


1) 根据 表 20-1 中 列 出 的 模式 ， 由 于 0x20AC 这 个 码 点 坐落 于 0x0800 
到 OxFFFF 之 间 ， 因 此 它 最 终 的 UTF-8 编 码 应 该 由 3 个 字 节 构成 。 因 此 我 
们 后 面 看 表 20-1 的 第 3 行 。 


2) 我 们 将 0x20AC 用 二 进 制 数 来 表示 ， 为 0010000010101100。 随 后 
我 们 将 这 些 比 特 插入 到 相应 字 节 中 。 


3) 字 节 1 具有 4 位 固定 前 导 比 特 1110， 而 低 4 位 用 于 存放 码 点 的 比 
特 ， 因 此 字 节 1 正好 可 以 将 码 点 的 高 4 位 放 进 去 ， 那 么 得 到 11100010。 


4) 字 节 2 具有 2 个 固定 的 前 导 比 特 10， 可 存放 6 位 码 点 比特 ， 因 此 
把 后 续 6 位 码 点 的 二 进 制 比特 插入 进去 得 到 10000010。 


5) 字 节 3 具有 两 个 国定 的 前 导 比 特 10， 可 存放 6 位 码 点 比特 ， 因 此 
我 们 可 以 将 剩余 的 6 位 码 点 二 进 制 比特 插入 进去 得 到 10101100 。 


这 样 ， 我 们 整理 得 到 欧元 符号 € 的 UTF-8 编 码 的 二 进 制 表示 为 : 
111000101000001010101100。 用 十 六 进 制 表 达 则 是 0xE282AC 。 


20.2 ”UTF-16 字 符 编码 格式 


在 20 世 纪 80 年 代 ， 人 们 开发 出 了 双 字 节 字 符 编码 格式 ， 那 时 就 将 
它 称 为 “Unicode”。 随 后 ， 随 着 各 种 语言 符号 的 加 入 ， 人 们 很 快 发 现 单 
单 用 双 字 节 来 表示 一 个 字符 远 远 不 够 ， 而 此 时 已 经 有 许多 开发 商 基 于 
这 种 双 字 节 字 符 编 码 做 了 许多 大 型 项 目 。 比 如 Java 一 开始 就 是 基于 这 
种 双 字 市 编码 的 字符 格式 的 ， 所 以 它 能 够 支持 使 用 汉字 或 其 他 文字 来 
定义 某 个 标识 符 ， 而 不 仅仅 用 ASCII 码 字符 。 到 了 1996 年 ，Unicode 标 
准 开 发 了 2.0 版 本 ， 将 原先 的 双 字 节 字 符 编 码 改造 为 变 长 的 字符 编码 格 
式 ， 称 为 UTF-16 字 人 符 编 码 ， 而 之 前 的 “Unicode” 则 改称 为 “UCS-2” 编 码 
格式 ， 其 中 UCS 表 示 通 用 字符 集 。 


因此 ，UTF-16 也 是 变 长 的 Unicode 字 符 编 码 格 式 ， 不 过 它 与 UTF-8 
不 同 的 是 ， 它 只 有 两 种 长 度 ， 一 种 是 占用 2 字 广 的 编码 格式 ， 这 种 编码 
格式 与 UCS-2 完 全 兼容 ， 还 有 一 种 就 是 4 字 市 编码 格式 。UTF-16 也 
有 “ 码 点 ”这 个 概念 ， 并 且 一 个 字符 的 码 点 与 UTF-8 编 码 中 的 码 点 值 都 
是 一 样 的 ， 因 为 这 些 都 是 由 Unicode 组 织 来 制定 的 。 


UTF-16 编 码 根 据 字 符 对 应 的 码 点 值 ， 由 三 种 不 同 区 间 范 围 而 做 出 
了 不 同 的 定义 。 


(1) 从 0x0000 到 0x7FFF 以 及 从 0xE000 到 0xFFFF 两 个 区 间 范 围 


坐落 在 这 两 个 区 间 范 围 内 的 UTF-16 编 码 表 示 起 来 非常 简单 ， 就 是 

当前 字符 所 对 应 的 码 点 值 本 喘 。 这 也 是 UTF-16 与 UCS-2 相 兼容 的 区 
间 。Unicode 将 坐落 于 这 两 个 区 间 范 围 内 的 码 点 称 为 基本 多 语言 平面 

(Basic Multilingual Plane) ， 简 称 BMP。 比 如 ， 像 美元 49 符号， 它 在 
Unicode 中 的 码 点 与 ASCII 码 中 的 一 样 ， 均 为 0x24， 所 以 它 的 UTF-16 编 
码 即 为 0x0024。 注 意 ， 尽 管 它 用 一 个 字 节 即 可 表示 ， 但 对 于 UTF-16 来 
说 ,仍然 需 要 占用 2 个 字 节 。 而 欧元 符号 在 Unicode 中 的 码 点 为 
0x20AC， 所 以 它 对 应 的 Unicode 编 码 值 即 为 0x20AC 。 


(2) 从 0x010000 到 0x10FFFF 范 围 


我 们 看 到 ， 这 个 区 间 内 的 码 点 用 两 个 字 节 已 经 无 法 表达 ， 所 以 对 
于 UTF-16 编 码 而 言 殴 需要 动用 4 个 字 下 进行 描述 。 这 个 范围 区 间 又 称 
为 补充 平面 (Supplementary Plane) ， 像 Emoji、 一 些 历史 脚本 、 非 常 
少 用 的 汉字 等 都 坐落 于 此 平面 中 。 那 么 在 此 范围 内 的 UTF-16 编 码 应 该 
如 何 计算 呢 ? 可 以 通过 以 下 三 步 来 获得 : 


1) 将 码 点 值 减 去 0x010000， 然 后 取 差 的 低 20 位 ， 使 得 结果 留 在 
0x000000 到 0x0OFFFFF 。 


2) 取 步 又 1 所 得 结果 的 高 10 位 ， 范 围 在 0x0000 到 0x03FFE， 将 它 加 
上 0xD800， 得 到 第 一 个 16 位 编码 单元 ， 这 也 称 为 高 位 蔡 换 ， 该 值 的 范 


围 在 0xD800 到 0xDBFF。 


3) 对 于 由 步骤 1 所 得 结果 的 低 10 位 (范围 也 在 0x0000 到 
0x03FF) ， 将 它 加 上 0xDC00， 得 到 第 二 个 16 位 编码 单元 ， 这 也 称 为 低 
位 远 换 ， 该 值 的 范围 在 0xDC00 到 0xDEFFF 。 


我 们 这 里 举 两 个 例子 来 说 明码 点 落 在 0x010000 到 0x10FFFF 范 围 字 
符 的 UTF-16 编 码 如 何 表示 。 首 先 我 们 看 一 个 德 撒 律 字母 立 ， 该 字母 的 
码 点 定义 为 0x10437。 第 一 步 ， 我 们 移 将 该 码 点 值 减 去 0x10000， 得 到 
0x0437。 取 该 值 的 低 20 位 ， 得 到 二 进 制 值 00000000010000110111。 然 
后 ， 取 它 高 10 位 一 一 0000000001， 对 应 十 六 进 制 值 为 0x0001， 将 它 加 
上 0xD800 之 后 得 到 0xD801， 因 此 它 的 第 一 个 16 位 编码 单元 的 值 就 是 
0xD801。 最 后 ， 取 20 位 值 的 低 10 位 ， 得 到 0000110111， 对 应 十 六 进 制 
值 为 0x0037， 将 它 加 上 0xDC00 得 到 0xDC37， 因 此 它 的 第 二 个 16 位 编 
码 单元 的 值 就 是 0xDC37。 最 后 我 们 得 到 整个 德 撤 律 字 母 Y¥ 的 UTF-16 编 
码 表 示 为 : 0xD801 DC37。 


第 二 个 例子 是 古代 汉字 “”【〈 同 “ 碎 ”) ， 它 的 码 点 定义 为 0x24B62。 
第 一 步 ， 我 们 先 将 该 码 点 值 减 去 0x10000， 得 到 0x14B62。 第 二 步 取 它 
的 低 20 位 ， 得 到 二 进 制 值 00010100101101100010。 第 三 步 ， 取 前 10 
位 ， 得 到 0001010010， 对 应 十 六 进 制 值 为 0x0052， 将 它 加 上 0xD800 之 
后 得 到 0xD852， 因 此 第 一 个 16 位 编码 单元 的 值 就 是 0xD852。 第 四 步 ， 


取 刚 才 所 得 20 位 值 的 低 10 位 ， 得 到 1101100010， 对 应 十 六 进 制 值 为 


0x0362， 将 它 加 上 0xDC00 得 到 0xDF62， 因 此 第 二 个 16 位 编码 单元 的 


值 就 是 0xDF62。 最 终 ， 该 汉字 的 UTF-16 编 码 表示 为 0xD852 DF62。 
(3) 范围 从 0xD800 到 0xDFFF 的 区 间 


Unicode 永 久保 留 了 这 两 个 区 间 不 允许 定义 任何 有 意义 的 字符 码 
点 。 因 为 我 们 通过 上 面 从 0x010000 到 0x10FFFF 范 围 的 UTF-16 编 码 表示 
法 就 已 经 知道 这 个 区 间 用 于 4 字 节 UTF-16 编 码 的 高 位 替换 与 低位 替换 
区 间 ， 所 以 不 能 用 来 定义 码 点 值 ， 否 则 会 在 编码 上 产生 歧义 。 


20.3 ”代码 示例 


我 们 前 面 已 经 将 UTF-8 编 码 规则 以 及 UTF-16 编 码 规则 完整 地 摘 述 
过 了 。 下 面 我 们 束 要 开始 实现 对 这 两 种 编码 方式 的 相互 转换 并 制作 其 
他 一 些 常 用 操作 工具 函数 。 


首先 要 声明 的 是 ， 这 份 代码 示例 可 以 从 笔者 的 GitHub 上 获得 完整 
的 代码 资源 : https://github.com/zenny-chen/UTF-8-and-UTF-16-string- 


utilities ° 


该 项 目 由 三 个 文件 构成 ，zennyChar.h 包 含 了 编码 转换 工具 的 对 外 
函数 接口 ，zennyCharc 用 于 对 编码 转换 工具 的 相关 函数 进行 实现 ; 
main.m 是 一 个 Objective-C 源 文件 ， 因 为 Objective-C 中 的 字符 串 对 象 目 
号 文 持 UTF-16 编 码 ， 所 以 我 们 可 以 用 来 校准 结 采 是 否 正 确 。 如 采 我 们 
在 macOS 下 测试 这 些 代码 ， 那 么 可 以 创建 一 个 Foundation 控 制 台 工程 即 
可 编译 运行 ， 倘 大 在 Ubuntu 系统 下 ， 那 么 可 以 根据 笔者 的 这 篇 博文 来 
安装 Objective-C 的 运行 时 环境 : http:/www.cnblogs.com/zenny- 
chen/p/4080067.html 。 


下 面 ， 我 们 就 先 来 看 zennyCharh 头 文件 的 内 容 ， 见 代码 清单 20- 


代码 清单 20-1 ”zennyChar.h 头 文件 内 容 


#ifndef UTF_trans_zennyChar_h 
#define UTF_trans_zennyChar_h 


#include <stdbool.h> 
#include <stdint.h> 
#include <stddef.h> 


pA 

* 将 UTF16 字 符 串 转 为 UTF8 字 符 串 

@param pUTF16 指向 目的 存放 UTF16 字 符 串 的 缓存 地 址 
E 地 址 


. 


* 

* @param pUTF8 指向 源 UTF8 字 符 串 缓 右 
* @param pUTF16Length 指向 存放 目的 UTF16 字 符 串 长 度 的 变量 首 地 址 ， 如 果 转 换 成 功 ， 
此 指针 不 空 ， 那 么 将 最 终 UTF16 字 符 串 的 长 度 存放 进 


咎 串 
上 
* @return 若 转换 成 功 返回 true， 否 则 返 
yh 

extern bool ZennyUTF8TOoUTF16(uint16_t pUTF16[], const char *pUTF8, 
size_t *pUTF16Length ) ， 


Er Ey 
不 


J 

* 从 UTF8 字 符 串 获得 相应 UTF16 字 符 串 的 长 度 
* @param utf8Str 指向 UTF8 字 符 串 首 地 址 
* @return 相应 UTF16 字 符 串 长 度 


*/ 
extern size_t ZennyGetUTF1i6LengthFromUTF8(const char *utf8Str); 


pe 

* 将 UTF16 字 符 串 转 为 UTF8 字 符 串 

* @param pUTF8 指向 目的 存放 UTF8 字 符 串 的 缓存 首 地 址 

* @param pUTF16 指向 源 存放 UTF16 字 符 串 的 缓存 首 地 址 

* @param pUTF8Length 指向 存放 目的 UTF8 字 符 串 长 度 的 变量 指针 ; 当 转 换 成 功 时 ， 
者 PUTF8Length 不 空 ， 则 将 转换 后 的 UTF8 字 符 串 的 长 度 存放 进 

* @return 若 转 换 成 功 返 回 true， 否 则 返回 false 

*/ 

extern bool ZennyUTF16ToUTF8(char pUTF8[], const uint16_t *pUTF16, 

size_t *pUTF8Length ) ， 


五 


yA 

* 从 UTF16 字 符 串 获得 相应 UTF8 字 符 串 的 长 度 

* @param utf16Str 指向 源 UTF16 字 符 串 的 首 地 址 

* @return 相应 UTF8 字 符 串 的 长 度 

*/ 

extern size_t ZennyGetUTF8LengthFromUTF16(const uint16_t *utf1i6Str); 


pA 

* 获得 指定 UTF16 字 符 串 的 长 度 
* @param s UTF16 字 符 串 首 地 址 

* @return UTF16 字 符 串 长 度 

*/ 

extern size_t ZennyUTF1i6StrLen(const uint16 t *s); 


Ud 
于 
未 
油 


A/ 
* 将 dst 所 存放 的 字符 串 内 容 与 src 所 存放 的 字符 串 内 容 拼 接 (dst 内 容 为 头 ，src 内 容 为 尾 ) ， 

然后 将 结果 存放 入 dst 的 缓存 中 
* @warning dst 必 须 有 足够 的 存储 空间 来 存放 结果 字符 串 内 容 
* @param dst 指向 目的 UTF16 字 符 串 以 及 作为 源 UTF16 字 符 吓 


也 
U1. 


ny 
IE 
‘> 
Tt 
HK 
TT 


@param src 指向 源 UTF16 字 符 串 尾部 内 容 
@return 如 果 拼 接 成 功 ， 指 向 dst; 否则 指向 空 


extern const uint16_t* ZennyUTF16StrCat(uint16 t dst[], const Uint16_t src[]); 


#endif 


代码 清单 20-1 已 经 将 本 项 目 所 提供 的 字符 串 操 作 工 具 全 都 列 出 来 
了 。 这 其 中 不 仅 包含 了 UTF-8 编 码 字 符 串 转 UTF-16 编 码 字符 串 ， 而 且 

包含 了 获取 UTF-8 字 符 串 的 长 度 以 及 UTF-16 字 符 串 的 长 度 ， 还 有 
UTF-16 编 码 字 符 串 的 拼接 。 


代码 清单 20-2 将 列 出 这 些 对 外 接口 函数 的 实现 。 


代码 清单 20-2 UTF-8 与 UTF-16 编 码 工具 外 部 画 数 接口 的 实现 


#include "zennyChar.h" 
bool ZennyUTF8ToUTF16(uint16_t pUTF1i6[], const char *pUTF8, size_t *pUTF16Length ) 


if(pUTF16 == NULL || pUTF8 == NULL) 
return false,; 


size_t orgIndex = 0, dstIindex = 0; 
char ch; 


while((ch = pUTF8[orgIndex]) != '\0') 
{ 


uint32_t result = 0; 
int length = 0， 


// counting leading '1' for number of UTF-8 bytes 
uint32_t firstByteFlag = (uint32_t)ch & Oxfc,; 
while( (firstByteFlag & Ox80) != 0) 

{ 


firstByteFlag <<= 1; 
length++; 
} 


// 若 长 度 为 9， 则 
if(length == 0) 


Ck 


为 兼容 的 ASCII 码 


pUTF16[dstIndex++] = ch; 
orgIndex++; 
continue; 


} 
// 对 于 mac0S 系 统 ， 采 用 的 是 大 端的 Unicode 


// 先 拼 接 第 一 个 字 节 的 剩余 有 效 比 特 
result = (uint32_ t)ch & (9xffU >> (length + 1)); 


// 对 于 UTF-8 字 节 数 小 于 4 的 ， 说 明 是 基本 多 语言 平面 (BMP) ， 对 应 于 Unicode 一 定 为 


// 遇 个 字 节 。 对 于 大 于 3 字 贡 数 的 UTF-8 则 被 扩充 剑 21 位 的 Unicode 
int base ， 
Switch(Jlength ) 


case 2: 
base = 11; 
break; 


case 3: 
base = 16; 
break; 


case 4: 
default: 
base = 21; 
break; 


} 

int shiftedBitPosition = base - (8 - (length + 1)); 
result <<= shiftedBitPosition; 

int i = 1; 

// 再 拼接 其 余 字 贡 的 比特 位 


do 
{ 


shiftedBitPosition -= 6; 
result |= ((uint32_t)pUTF8[++orgIndex] & Ox3f) << shiftedBitPosition; 


} 
while(i < length); 


// 对 于 UTF-8 字 节 数 小 于 4 的 ， 说 明 是 基本 多 语言 平面 (BMP) ， 
// 对 应 于 Unicode 一 定 为 两 个 字 节 
if(length < 4) 
pUTF16[dstIndex++] = result; 
else 


{ 
// 对 于 大 于 3 字 节 数 的 UTF-8， 则 采用 高 低 交 替 对 码 点 格式 
result -= Ox00010000; 
uint16_t high = result >> 10; 
Uint16_t low = result - (high << 10); 
pUTF16[dstIndex++] = high + Oxd800; 
pUTF16[dstIndex++] = low + 0xdc00; 


} 


orgIndex++; 


} 
pUTF16[dstIndex] = u'\0'，; 


if(pUTF16Length != NULL) 
*pUTF1i6Length = dstIndex,; 


return true; 


} 
size_t ZennyGetUTF16LengthFromUTF8(const char *utf8Str) 


if(utf8Str == NULL) 
return 9; 


size_t orgIndex = 0, dstLength = 0,; 


char ch 


while((ch = utf8Str[orgIndex]) != '\0') 
{ 


int length = 0,; 


之 多 


// 对 UTF-8 字 节 序列 计算 前 导 1 的 个 数 ， 有 多 少 个 前 导 1 说 明 该 


于 付 


Uint32_t firstByteFlag = (uint32_t)ch & Oxfc; 
while( (firstByteFlag & Ox80) != 0) 


firstByteFlag <<= 1; 
length++; 
} 


if(length 0) 
length = 1; 


orgIndex += length, 


int addition = length > 3? 2 
dstLength += addition; 


1; 


} 
return dstLength,; 
} 
bool ZennyUTF16ToUTF8(char pUTF8[], const uint16_t *pUTF16, 
if(pUTF8 == NULL || pUTF16 == NULL) 
return false,; 
size_t orgIndex = 0, dstIndex = 0; 
uint16_t ch; 
pUTF16[orgIndex]) != u'\0') 


while((ch = 
{ 


// 处 理 ASCII 码 兼容 情况 
if(ch < Ox80) 


pUTF8[dstIndex++] = ch; 
orgIndex++; 
continue; 


} 


// 处 理 16 位 Unicode 的 情况 (最 多 3 字 和 UTF-8) 
if(ch < Oxd800 || ch >= Oxe000) 


if((ch & Oxf800) == 0) 


// 高 5 位 为 0， 说 明 是 2 字 节 UTF-8 


Uint8_t value = (ch >> 6) | 0xcg0' 
pUTF8[dstIndex++] = Value 
value = (ch & Ox3f) | 0x80 
pUTF8[dstIndex++] = value; 
} 
else 
{ » + 
// 否则 为 3 字 节 UTF-8 
Uint8_t value = (ch >> 12) | 0xe0 
pUTF8[dstIndex++] = Value 
Value = (ch >> 6) & 0x3f， 
Value |= 0x80 
pUTF8[dstIndex++] = Value 


多 少 个 字 节 构成 


size_t *pUTF8Length) 


Value = ch & Ox3f,; 
value |= Ox80; 
pUTF8[dstIndex++] = value; 


} 
else 
{ ， 
// 处 理 21 位 Unicode 的 情况 
Uint32_t high = ch - 0xd800 
uint32_t low = pUTF16[++orgIndex] - 0xdc00， 
Uint32_t result = low + (high << 10); 
result += Ox00010000; 
uint8_t value = (result >> 18) | Oxf0; 
pUTF8[dstIndex++] = value; 
value = (result >> 12) & QOx3f; 
value |= Ox80; 
pUTF8[dstIndex++] = value; 
value = (result >> 6) & QOx3f,; 
value |= Ox80; 
pUTF8[dstIndex++] = value; 
value = (result & Ox3f) | Ox80; 
pUTF8[dstIndex++] = value; 
} 
orgIndex++; 


} 
puTF8[dstIndex] = '\0O'; 


if(pUTF8Length != NULL) 
*pUTF8Length = dstIndex; 


return true; 


} 
size_t ZennyGetUTF8LengthFromUTF16(const uint16 _t *utf16Str) 


if(utf16Str == NULL) 
return 9; 


size_t orgIndex = 0, dstLength = 0， 
uint16_t ch; 


while((ch = utf1i6Str[orgIndex]) != u'\0') 


// 处 理 ASCII 码 兼容 情况 
if(ch < Ox80) 


dstLength++; 
orgIndex++; 
continue; 


} 


// 处 理 16 位 Unicode 的 情况 (最 多 3 字 和 UTF-8) 
if(ch < 0xd800 || ch >= Oxe000) 


if((ch & Oxf800) == 0) 


// 高 5 位 为 96， 说 明 是 2 字 节 UTF-8 
dstLength += 2， 
} 


else 


dstLength += 3,; 


else 
// 否则 为 4 字 节 UTF-8 


dstLength += 4; 
orgIndex++; 


orgIndex++; 
return dstLength,; 


size_t ZennyUTF16StrLen(const uint16 t *s) 


if(s == NULL) 
return 0; 


size_t index; 
for(index = 0; s[index] != Uu'\0'; index++); 


return index; 


const uint16_t* ZennyUTF1i6StrCat(uint16_t dst[], const uint16 t src[]) 


if(dst == NULL || src == NULL) 
return NULL; 


size _t index = ZennyUTF1i6StrLen(dst); 


for(size t i = 0; src[i] != Uu'\0'; i++) 
dst[index++] = src[i]; 


dst[index] = u'\0O'，; 


return dst,; 


代码 清单 20-2 给 出 了 所 有 外 部 接口 钞 数 的 完整 的 实现 ， 并 且 在 一 
些 头 键 部 分 都 写 了 注释 。 由 于 编码 转换 的 算法 本 吴 并 不 太 复 杂 ， 所 以 
这 段 代码 注释 量 不 多 ， 而 且 很 容易 束 能 看 懂 。 


代码 清单 20-3 给 出 了 针对 此 编码 转换 工具 的 测试 。 


代码 请 单 20-3 ”编码 转换 工具 的 测试 


#import <Foundation/Foundation.h> 
#include <string.h> 


#include "zennyChar.h" 


int main(int argc, const char * argv[]) 


{ 

// 声明 一 个 s 字 符 数 组 ， 用 于 存放 一 个 UTF -8 字符 串 

const char s[] = u8" 你 好 ， 世界! aByDHello, world!"; 

printf("The length is: %zu, and the content is: %s\n", strlen(s), s); 

// 使 用 NSString 对 象 来 存放 这 个 字符 串 ， str 对 象 引 用 所 包含 的 字符 编码 已 经 转 为 了 UTF-16 

NSString *str = [NSString stringwithUTF8String:s]; 

NSLog(@"The length is: %zu, and the content is: %@", [str length], str); 

// 下 面 用 我 们 自己 实现 的 UTF-8 转 UTF-16 的 方法 进行 对 比 测试 

unichar buffer[64]; 

size_t length,; 

if(ZennyUTF8ToUTF16(buffer, s, &length)) 

NSLog(@"\nThe transformed UTF16 length is: %zu, and the string is: %@", 
length, [NSString stringwithCharacters:buffer length:length]); 

NSLog(@"The UTF16 string length from UTF8 is: %zu, and the original 
UTF16 string length is: %zu", ZennyGetUTF1i6LengthFromUTF8(s), 
ZennyUTF1i6StrLen(buffer)); 

// 再 将 UTF-16 编 码 的 字符 串 再 转 回 UTF- 8 编码 的 字符 串 

char chBuffer[64]; 

ZennyUTF16ToUTF8(chBuffer, buffer, &length); 

printf("\nThe transformed UTF8 length is: %zu, and the string is: %s\n", 

length, chBuffer ) ， 

length = ZennyGetUTF8LengthFromUTF16(buffer ) ， 

printf("The UTF8 length from UTF16 is: %zu\n\n", length); 

// 最 后 测试 一 人 zennyUTF16StrCat 画 数 

ZennyUTF16Strcat (buffer，u" 口 拜拜 ~")， 

length = ZennyUTF16StrLen(buffer ) ， 

NSLog(@"The UTF16 length is: %zu，and the content is: %@", length, 
[NSString stringwithCharacters:buffer length:length]); 

return ©; 

} 


代码 清单 20-3 中 的 测试 字符 串 中 既 包 含 中 文 、 英 文 、 希 腊 文 ， 同 
时 还 包括 了 Emoji， 因 此 测试 涉及 的 范围 比较 广 。 


20.4” ”本章 小 结 


本 章 详细 介绍 了 UTF-8 编 码 格式 以 及 UTF-16 编 码 格式 的 具体 规 
格 。 通 过 一 个 完整 的 项 目 我 们 介绍 了 如 何在 UTF-8 编 码 的 字符 串 与 
UTF-16 编 码 的 字符 串 之 间 相 互 转换 ， 如 何 获 取 UTF-16 字 符 串 的 长 度 
等 。 通 过 这 个 项 目 各 位 能 够 学 习 到 C 语 言 程序 设计 中 的 常用 技巧 ， 比 
如 对 外 函数 接口 通过 一 个 头 文件 进行 说 明 ， 还 有 C 语 言 代码 中 对 画 
数 、 对 象 命名 的 习惯 规则 ， 


尽管 本 项 目的 实际 算法 不 算 复杂 ， 但 是 它 已 经 具备 一 定 的 模块 化 
设计 思想 ， 我 们 直接 将 它 作为 库 使 用 也 完全 没有 问题 。 


第 21 章 ”制作 欣 制 合计 算 骨 


我 们 在 前 一 章 介 绍 了 UTF-8 与 UTF-16 之 间 相 互 转 码 的 算法 工具 ， 
如 果 说 这 个 项 目 还 算 比 较 简单 的 话 ， 那 么 本 章 将 要 介绍 的 项 目 将 会 复 
杂 不 少 。 我 们 将 在 本 章 给 大 家 介绍 如 何 制作 基于 控制 台 的 计算 器 工 
有 具 o 


本 计算 需 的 功能 特性 有 以 下 几 点 。 


1) 用 户 通过 一 个 不 带 空格 的 完整 的 字符 串 作 为 该 程序 的 参数 ， 该 
字符 串 就 是 我 们 所 要 制作 的 程序 对 它 进 行 解析 的 算术 表达 式 。 假 定 我 
们 构建 出 来 的 程序 名 为 calculator， 那 么 我 们 在 控制 台 输 入 calculator 
1+2+3*4， 然 后 输入 回 车 ， 我 们 就 能 看 到 计算 结果 15。 


2) 本 计算 器 支持 的 运算 操作 包括 加 法 操作 (+) 、 减 法 操作 
(-) 、 乘 法 操作 (*) 、 除 法 操作 (V) ， 求 模 操 作 (%) ， 指 数 求 寡 
操作 〈A) 以 及 括号 操作 。 这 里 要 注意 的 是 ， 有 些 控制 台 将 圆 括号 视 作 
具有 特殊 意义 的 符号 ， 因 此 不 能 作为 程序 的 输入 参数 给 出 ， 而 我 们 这 
里 同时 支持 圆 括 和 号 和 方 括号 作为 括号 使 用 ， 在 解析 前 会 有 预 处 理 将 碰 
到 的 方 括号 全 都 转换 为 圆 括 号 。 


3) 本 计算 器 支持 以 下 这 些 常用 数学 范 数 ，sin 《正弦 函数 ) 、cos 
(余弦 函数 ) 、tan 〈 正 切 函 数 ) 、cot 〈 余 切 酚 数 ) 、sinh ( 双 曲 正弦 
函数 ) 、cosh 〈 双 曲 余弦 函数 ) 、tanh 〈 双 曲 正切 函数 ) 、asin (反正 
纺 函 数 ) 、acos 〈 反 余 弱 函数 ) 、atan 〈 反 正切 函数 ) 、asnh 〈 反 双 曲 
正弦 函数 ) 、acsh 〈 反 双 曲 余弦 函数 ) 、log 〈 求 底数 为 2 的 对 数 ) 、1g 
( 求 确 数 为 10 的 对 数 ) 、In 〈 求 砌 数 为 e 的 对 数 ) 、sqrt ( 求 平方 
根 ) 、cbrt ( 求 立方 根 ) 、recp ( 求 倒数 ) 、rad (将 角度 值 转 为 弧度 
值 ) 、deg 〈 将 弧度 制 转 为 角度 值 ) 、exp ( 求 e 的 占 ) 。 这 些 数学 函数 
都 只 售 一 个 参数 ， 并 且 需 要 使 用 括号 将 参数 包 囊 起 来 ， 比 如 : 


calculattor log[4]+sqrt[9] ° 


: 
( 


六 


六 


4) 本 计算 器 还 支持 两 个 数学 常量 ， 一 个 是 e， 一 个 是 pi。 比 如: 


calculator sin (pi) + cos (0) -eA2。 


5) 在 参数 字符 串 中 ， 所 有 字母 均 可 以 用 大 写 和 小 写 ， 解 析 程 序 的 
预 处 理 器 会 将 所 有 大 写字 母 转换 为 小 写字 母 。 


下 面 ， 我 们 将 先 介绍 此 代码 中 的 一 些 关 键 思想 ， 然 后 给 出 完整 的 
源 代码 。 


21.1 对 数字 的 解析 


计算 稻 中 的 算式 解析 过 程 中 最 重要 的 步骤 之 一 吏 是 要 将 数字 、 损 
作 符 、 函 数 名 等 元 素 解 析出 来 。 其 中 对 数字 的 解析 征 最 复杂 的 ， 因 此 
我 们 单独 通过 一 市 来 为 大 家 介绍 如 何 解析 算式 中 的 数 子 。 


首先 ， 我 们 要 定义 好 在 算术 表达 式 中 哪些 数字 表达 是 合法 的 ， 哪 
些 是 不 合法 的 。 在 本 计算 器 程序 中 ， 这 些 都 是 合法 的 数字 : 10， 
20.5，.23，0。 而 这 些 不 是 合法 的 数字 : 36.52.34， 因 为 在 52 之 前 已 经 
有 了 一 个 小 数 点 ， 而 在 34 之 前 又 出 现 了 一 个 ， 此 时 解析 器 会 在 34 之 前 
的 那个 小 数 点 处 停止 解析 ， 然 后 直接 返回 当前 状态 。 


有 了 上 述 合 法 数 子 表达 的 定义 之 后 ， 我 们 区 ® 可 以 依 此 构造 出 一 个 
状态 机 了 ， 如 图 21-1 所 示 。 


图 21-1 中 ， 实 心 圆圈 表示 起 始 状态 ， 实 心 圆圈 外 面 再 加 一 圈 的 图 
轿 表 示 终 止 状态 ， 在 实际 程序 中 则 表示 当前 数字 解析 函数 的 返回 ; 直 
角 和 矩形 表示 一 个 动作 行为 ， 圆 角 矩 形 则 表示 当前 状态 ， 萎 形 表示 条 件 
判断 。 由 于 数学 向量 也 表示 一 个 特定 的 数 ， 所 以 这 里 将 数学 币 量 与 一 
般 的 数字 放 在 一 起 解析 。 


21.2 ”对 操作 符 的 优先 级 处 理 


为 了 使 我 们 的 算术 表达 式 尽 可 能 与 数学 上 的 和 常用 表达 匹配 ， 我 们 
就 需要 对 计算 操作 符 做 运算 优先 级 的 处 理 。 在 本 计算 器 程 序 中 安排 了 
四 个 优先 级 ， 以 下 按照 从 小 到 大 的 次 序 排列 : 


1) + (加 ) 、- ( 减 ) : 加 法 与 减法 操作 符 的 优先 级 是 最 低 的 。 


2) * 〈 乘 ) 、/ ( 除 ) 、% ( 求 模 ) : 这 些 运算 操作 的 优先 级 处 于 


3) ^〈 需 ) : 指数 计算 的 优先 级 处 于 第 三 等 级 。 


4) 括号 : 括号 的 运算 优先 级 是 最 高 的 。 这 里 要 说 明 的 是 ， 由 于 数 
学 函数 后 面 必 须 跟 括 号 ， 所 以 函数 操作 的 优 移 级 也 要 大 于 以 上 3 类 操作 
符 的 优先 级 。 


无 效 数值 


判定 后 一 个 字符 
是 否 为 0 到 9 


已 包含 浮 点 
的 浮 点 数 


潜入 一 个 字符 


是 否 为 0 到 9 


图 21-1 数字 解析 状态 机 


对 于 相同 优先 级 的 运算 操作 ， 在 同一 函数 调用 层 中 按照 从 左 到 右 
的 顺序 做 归 约 计算 ， 比 如 : 1+2-3， 其 计算 次 序 就 是 先 计 算 1+2 的 值 ， 
然后 再 计算 3-3 的 值 。 


对 于 过 到 比 当 前 计算 优先 级 更 高 的 计算 操作 时 ， 本 计算 器 解析 程 
序 将 采用 递归 方式 进行 计算 。 比 如 1+2* (3+4) ， 其 递归 调用 次 序 如 图 
21-2 所 示 。 


图 21-2 ”四 则 运算 的 递归 调用 逻辑 


图 21-2 中 展示 了 计算 式 1+2* (3+4) 的 递归 调用 次 序 。 首 先 ， 解 析 
绥 遇 到 1+2 时 碍 看 后 面 那 个 操作 符 的 优 和 级 ， 由 于 乘法 优 爷 级 大 于 加 
法 ， 因 此 将 2* 操 作 作为 递归 调用 。 随 后 遇 到 (符号 ， 那 么 它 的 优先 级 
比 乘法 操作 高 ， 因 此 再 做 一 层 递 归 调 用 。 在 第 三 层 调用 中 ， 将 3+4 的 绪 
果 计 算 完 之 后 返回 到 第 二 层 调用 ， 做 2*7 的 操作 ， 然 后 完成 该 计算 之 后 
再 返回 到 第 一 层 调用 ， 完 成 最 后 的 1+14 的 计算 ， 最终 得 到 计算 结 
15° 


而 对 于 计算 表达 式 2+3*4+5，2+ 处 于 第 一 层 调 用 ， 而 后 面 的 3*4+5 
作为 第 二 层 调用 ， 由 于 加 法 计算 满足 结合 律 ， 所 以 在 这 种 情况 下 就 相 
当 于 (2+3*4) +5=2+ (3*4+5) 。 这 里 的 一 个 副作用 是 减法 不 满足 结合 
律 ， 因 此 我 们 要 计算 减法 的 时 候 ， 实 际 上 要 将 减 号 的 右 操作 数 做 取 相 
反 数 操作 ， 然 后 将 减法 变 成 加 法 。 比 如 ， 我 们 要 计算 1-2*3-4， 我 们 就 
要 将 它 转 为 : 1+ (-2) *3+ (-4) 。 


21.3 ”代码 示例 
我 们 前 面 已 经 大 致 介绍 了 这 款 控制 台 计算 器 程序 。 下 面 我 们 就 要 
开始 实现 此 控制 台 计 算 器 的 具体 代码 。 


站 和 完 要 声明 的 是 ， 这 份 代码 示例 可 以 从 笔者 的 GitHub 上 获得 完整 
的 代码 资源 : https://github.com/zenny-chen/SimpleCalculator 


该 项 目 就 仅 由 一 个 main.c C 源 文件 构成 。 这 里 面包 含 了 main 了 范 数 
以 及 对 计算 表达 式 的 解析 和 相关 处 理 函 数 。 代 码 清单 21-1 展 示 了 main.c 
中 的 所 有 内 容 。 


代码 清单 21-1 ”main.c 源 代码 


#include <stdio.h> 
#include <string.h> 
#include <math.h> 
#include <stdlib.h> 
#include <stdbool.h> 
#include <stdint.h> 
#include <stdalign.h> 


/** 我 们 这 里 使 用 简约 的 var 作 为 对 象 类 型 的 自动 推导 */ 

#define va auto_type 

/** 我 们 指定 输入 表达 式 的 最 大 长 度 为 2047 字 节 ， 超 出 部 分 将 被 截断 */ 
#define MAX_ARGUMENT_LENGTH 2047 


/** 用 于 标记 解析 符号 时 的 当前 状态 */ 
enum PARSE_PHASE_STATUS 
{ 


PARSE_PHASE_STATUS_LEFT_OPERAND = 0， 
PARSE_PHASE_STATUS_RIGHT_OPERAND, 
PARSE_PHASE_STATUS_LEFT_PARENTHESIS, 
PARSE_PHASE_STATUS_NEED_OPERATOR = 4, 
PARSE_PHASE_STATUS_HAS_NEG = 8 


】 
/** 当前 算术 计算 优先 级 */ 


enum OPERATOR_PRIORITY 


{ 
/** 加 减法 优先 级 */ 
OPERATOR_PRIORITY_ADD, 


/** 乘除 以 及 求 模 优先 级 */ 
OPERATOR_PRIORITY_MUL， 


/** 第 运算 优先 级 */ 
OPERATOR_PRIORITY_POW 

}; 

/** 判定 当前 字符 是 否 属于 数字 */ 

static inline bool IsDigital(char ch) 


{ 
return ch >= '0' && ch <= '9'， 
} 
XR 
* 


判定 当前 是 否 为 数学 常量， 本 
* @return 如 果 是 数学 常量 ， 则 返回 该 常量 的 字符 个 数 ， 否 则 返回 9 
*/ 

static inline int IsMathConstant(const char *cursor) 


if(cursor[0] == 'p' && cursor[1] == 'i') 
return 2; 


// 由 于 本 程序 还 支持 exp 画 数 用 于 计算 e 的 指数 军 ， 
// 所 以 如 果 后 面 e 后 面包 含 了 一 个 x， 那 么 这 个 e 就 不 会 是 数学 常量 
if(cursor[0] == 'e' && cursor[1] != 'x') 

return 1; 


加 


return 0) 


} 


/** 判定 当前 字符 是 否 可 能 为 画 数 */ 
static inline bool IsMathFunction(char ch) 


{ 
} 


/** 对 数字 进行 解析 */ 
static double ParseDigital(const char *cursor, int *pRetLength) 


{ 
// 我 们 先 判断 当前 是 否 为 数学 常量 
var length = IsMathConstant(cursor); 
if(length > 0) 
{ 


return ch >= 'a' && ch <= 'z'，; 


*pRetLength = length; 
return (cursor[0] == 'p')? M PI : M_E; 
} 


char value[MAX_ARGUMENT_LENGTH + 1]; 


char ch; 
var index = 0; 
var hasDot = false; 


do 
{ | 
ch = cursor[index]; 
if(ch == '.') 
// 如 果 之 前 已 经 出 现 了 小 数 点 ， 那 么 这 里 就 中 断 解 析 
if(hasDot) 


break; 


else 


hasDot = true; 
value[index] = ch,; 


} 


} 
else if(!IsDigital(ch)) 
break; ”// 在 其 余 情况 下 ， 倘 车 不 是 数字 ， 则 立即 中 断 解析 


value[index++] = ch; 
ai != '\0'); 
value[index] = '\0'， 
*pRetLength = index; 
// atof 函 数 是 将 一 个 字符 数组 中 的 内 容 转 为 一 个 doub1e 类 型 的 浮 点 数值 


// 该 画 数 在 <stdlib ,h> 头 文件 中 声明 
return atof (value); 


} 
static double Addop(double a, double b) 
{ 

return a + b; 
} 
static double MinusOp(double a, double b) 
{ 

return a - b; 
} 
static double MulOp(double a, double b) 
{ 

return a * b， 
} 
static double Divop(double a, double b) 
{ 

return a / b; 
} 


static double Modop(double a, double b) 


// 由 于 求 模 操作 时 ， 操 作 数 必 胁 是 整数 ， | 
// 所 以 我 们 这 里 将 8 与 b 都 转换 为 带 符号 的 64 位 整数 类 型 
return (int64 t)a % (int64 t)b; 


} 


/** 定义 了 一 个 操作 函数 表 ， 方 便 快 速 定 位 当前 操作 符 所 对 应 的 操作 画 数 */ 
static double (* const opFuncTables[])(double, double) = { 
// 为 了 进一步 节省 全 局 存储 空间 ， 我 们 这 里 将 根据 ASCII 码 表 找 出 最 小 的 字符 值 ， 
// 将 该 值 作为 90， 后 续 的 都 减 去 该 值 。 通 过 ASCII 表 可 以 知道 ， 值 最 小 的 符号 是 % 
// 0 交 后 我 们 可 以 用 指定 索引 的 初始 化 器 对 opFuncTables 进 行 初始 化 


['%' - '%'] = &Modop， 
['*' - '%'] = &Mulop, 
['+' - '%'] = &Addop, 

'-' - '%'] = &Minusop, 
['/' - '%'] = &Divop, 
['^' - '%'] = &pow 


}; 
/** 判定 是 否 为 有 效 操作 符 * 


static inline bool IsOperator(char ch) 


return (ch >= '%' 8&& ch <= 1/') || ch == 9 


} 


static double radian(double degree) 


{ 
return degree * M PI / 180.0; 
} 
static double degree(double radian) 
{ 
return radian * 180.0 / M_PI; 
} 
static double cot(double radian) 
{ 
return tan(M PI * 0.5 - radian); 
} 
static double recp(double x) 
{ 
return 1.0 / x; 
} 
static const struct 
{ 


int name; 

double (*pFunc)(double); 
} mathFuncList[] = { 
'\QOnis', &sin } 
'\QOsoc', &cos } 
'\Onat', &tan } 
'\Otoc', &cot } 
'hnis', &sinh } 
'hsoc', &cosh } 
'hnat', &tanh } 
'Nnisa', &asin }, 
'soca', &acos }, 
'nata', &atan }, 
'hnsa', &asinh }, 
'hsca', &acosh }, 
'\0g0ol1', &lo0g2 } 
'\O0\0g1', &10g10 }, 
'\O\O0nN1', &l0og }, 
'trqs', &sqrt }, 
'trbc', cbrt }, 
'pcer', &recp }, 
'\Odar', &radian }, 
'\Oged', &degree }, 
'\Opxe', &exp } 


~ 


mr 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 


】 


static double (*ParseMathFunction(const char *cursor, int *pLength))(double) 


{ 


// 这 里 buffer 至 少 要 求 4 字 节 对 齐 。 因 为 我 们 后 面 会 对 前 4 个 字 节 内 容 进行 同时 访问 
char alignas(4) buffer[8] = { '\0" }; 
Var index = 0; 


// 由 于 这 里 规定 的 数学 符号 最 多 占用 4 个 字 节 ， 所 以 需要 用 一 个 计数 器 
for(var count = 0; count < 4; count++, index++) 


{ 


-| 


防止 访问 越界 


var ch = cursor[index]; 

if(!IsMathFunction(ch)) 
break; 

buffer[index] = ch,; 


} 
buffer[index] = '\0',， 


// 同时 取出 刚才 所 存放 的 4 个 字 节 内 容 ， 方 便 比 较 


var value = *(int*)buffer; 


// 查找 范 数 表 中 是 否 含 有 该 函数 名 
const var length = sizeof(mathFuncList) / sizeof(mathFuncList[0]); 
for(typeof(length + 0) i = 0; i < length; i++) 


if(mathFuncList[i].name == value) 


*pLength = index; 
return mathFuncList[i].pFunc; 


} 


return NULL; 
} 


/ 


* 


解析 当前 的 算术 表达 式 
@param ppCursor 指向 当前 算术 表达 式 字符 串 的 地 址 。 
它 既 是 输入 又 是 输出 。 当 当前 算术 表达 式 作为 括号 进行 计算 时 ， 
To 年 不 括 号 的 位 输出 到 实 参 
@param leftoperand 当前 左 操 作 数 的 值 
@param status 当前 计算 状态 
@param priority 当前 计算 的 算术 优先 级 
@param pStatus 输出 解析 状态 
@return 输出 计算 表达 式 的 结果 


static double ParseArithmeticExpression(const char **ppCursor, double 
leftOperand, enum PARSE_PHASE_STATUS status, enum OPERATOR_PRIORITY 
priority, bool *pStatus ) 

{ 


A 光 交 光头 
全 
昌 
Ky 


* 


const char *cursor ppCursor; 


二 大 
var rightoperand 0.0; 


var length = 


操作 符 画 数 的 指针 
(*pOpFunc)(double, double) = NULL; 


// 指向 数学 函数 的 指针 
double (*pMathFunc)(double) = NULL 


Wi 


// 指 
doubl 


[oo) 


I 


bool isSuccessful = true; 
char ch 

do 

{ 


ch = *cursor; 


// 先 判 定 当前 字符 是 否 属于 数字 或 数学 常量 
if(IsDigital(ch) || IsSMathCconstant(cursor) > 0) 


mm 
an 


double value = ParseDigital(cursor, &length); 
cursor += length; 


if((status & PARSE_ PHASE_ STATUS_ RIGHT_ OPERAND) == PARSE_PHASE_ 
STATUS_LEFT_OPERAND ) 


Jeftoperand = Value 

// 如 果 具 有 负数 符号 ， 则 将 左 操作 数 做 取 相反 数 操作 

if((status & PARSE_PHASE_STATUS_HAS_NEG) != 0) 
leftOperand = -Leftoperand 


else 


{ 
// 对 于 当前 为 右 操作 数 的 情况 ， 根 据 操作 符 计算 优先 级 ， 
// 需要 进一步 判定 后 面 的 操作 优先 级 是 否 大 于 前 面 的 ， 
// 如 果 大 于 前 面 的 ， 则 需要 做 递归 计算 
rightOperand = Value 
// 如 果 具 有 负数 符号 ， 则 将 左 操 作 数 做 取 相 反 数 操作 
if((status & PARSE_PHASE_STATUS_HAS_NEG) != 0) 
rightoperand = -rightoperand 
} 


// 清除 负数 标志 
status &= ~PARSE_PHASE_STATUS_HAS_NEG; 


// 添加 后 续 需 要 算术 操作 符 的 状态 标志 
status |= PARSE_ PHASE_ STATUS_NEED OPERATOR; 


else if(IsMathFunction(ch)) 


{ 


pMathFunc = ParseMathFunction(cursor, &length); 
if(pMathFunc == NULL) 


// 如 果 数 学 函数 返回 空 ， 说 明 解析 失败 ， 立 即 中 断 解 析 


isSuccessful = false; 


break; 
} 
cursor += length; 
if(*cursor != '(') 
// 如 果 画 数 后 面 没 有 跟 ( ， 那 也 不 是 一 个 合法 的 表达 式 ， 立 即 中 断 解析 
isSuccessful = false; 
break; 
} 


else if(IsOperator(ch)) 


{ 


河 | 
fk 

hb 
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// 这 个 区 间 范 围 内 包含 了 常用 的 算术 操作 符 以 及 左 不 
// 因此 我 们 在 这 个 分 支 中 同时 对 这 两 类 符号 进行 解析 } 
if(ch == '(') 

{ 


些 E 


CuUrsort+; 


double value = ParseArithmeticExpression(&cursor, 0.0, 
PARSE_PHASE_STATUS_LEFT_OPERAND | PARSE_PHASE_STATUS_LEFT 


PARENTHESIS， OPERATOR_PRIORITY_ ADD, &isSuccessful); 


// 如 果 当 前 游标 所 指向 的 字符 不 是 ' )' ， 说 明 没有 匹配 到 合适 的 )， 中 断 解 析 
if(!isSuccessful || *cursor != ')') 


{ 


isSuccessful = false; 
break; 


} 


if((status & PARSE_ PHASE_ STATUS_ RIGHT_OPERAND) == 0) 


// 如 果 当 前 状态 为 左 操作 数 
if(pMathFunc != NULL) 


Jeftoperand = pMathFunc(value); 
pMathFunc = NULL; 


else 
Jeftoperand = value; 


} 
else 
{ A , » BE 2 AL 
// 如 果 当 前 状态 为 右 操作 数 
if(pMathFunc != NULL) 
rightoperand = pMathFunc(value); 
pMathFunc = NULL; 
} 
else 
rightoperand = value; 
} 


// 清除 当前 左 括号 状态 
status &= ~PARSE_PHASE_STATUS_LEFT_PARENTHESIS; 


// 添加 后 续 需 要 算术 操作 符 的 状态 标志 
status |= PARSE_PHASE_STATUS_NEED_OPERATOR; 


} 
else if(ch == ')') 


// 将 当前 游标 位 置 输出 给 实 参 
*ppCursor = cursor; 


return (pOpFunc != NULL)? pOpFunc(leftOperand, rightOperand) 


Jeftoperand ; 
} 
else 
{ 
if((status & PARSE_PHASE_STATUS_NEED_OPERATOR) == 0) 
if(ch == '-') 
{ 


// 如 果 当 前 不 需要 操作 符 ， 则 将 减 号 视 作 负数 符号 
// 作为 负数 符号 的 话 ， 后 面 必须 跟 一 个 数 ， 否 则 也 是 无 效 的 
if(IsDigital(cursor[1]) || IsMathConstant(&cursor[1]) > 


status |= PARSE_ PHASE_STATUS_HAS_NEG; 


else 
{ 
isSuccessful = false; 
break; 
} 
} 
else 
{ , [= A < 七 、 y 
// 对 于 其 他 情况 ， 如 果 当 前 状态 不 需要 操作 符 ， 那 么 表达 式 非 法 ， 
// 立即 中 断 解析 
isSuccessful = false; 
break; 
} 
} 
else 
{ 
var tmpFunc = opFuncTables[ch - '%']; 


if(tmpFunc == NULL) 


// 如 果 没 找到 对 应 的 操纵 符 函 数 ， 说 明 当 前 输入 字符 是 非法 的 ， 
// 直接 中 断 解析 


isSuccessful = false; 
break; 
} 
// 判定 当前 操作 符 的 计算 优先 级 
var pry = OPERATOR_PRIORITY_ADD ， 
if(tmpFunc == Modop || tmpFunc == MulOop || tmpFunc == DiVvOp) 
pry = OPERATOR_PRIORITY_MUL ， 
else if(tmpFunc == pow) 
pry = OPERATOR_PRIORITY_POW 


if(pOpFunc == NULL) 
popFunc = tmpFunc; 


if((status & PARSE_ PHASE_ STATUS_ RIGHT_OPERAND) == 0) 
{ 


// 当前 操作 符 解析 成 功 ， 后 续 将 需要 该 操作 的 右 操作 数 
status |= PARSE_PHASE_STATUS_RIGHT_OPERAND; 


} 


else 


{ 


// 如 果 之 前 优先 级 不 小 了 
if(priority >= pry) 
{ 


当前 操作 符 的 优先 级 ， 那 么 立即 做 归 约 


Jeftoperand = pOpFunc(leftOperand, rightOperand); 
rightoperand = 0.0; 

// 随后 更 新 当前 操作 画 数 以 及 计算 优先 级 

poOpFunc = tmpFunc; 


} 


else 


{ 


// 如 果 当 前 磁 到 了 比 之 前 优先 级 更 改 的 操作 符 
// 那么 我 们 采用 递归 的 方式 进行 计算 
if(pOpFunc == MinusOp) 


// 如 果 之 前 的 计算 是 减法 ， 那 么 根据 减法 不 适用 于 结合 律 的 
// 性 质 ， 我 们 这 里 将 它 作 为 一 个 加 法 ， 将 右 操作 数 取 负 
popFunc = Addop ; 

rightoperand = -rightoperand 


else if(pOpFunc == DivOp) 


// 如 果 之 前 的 计算 是 除法 ， 那 么 根据 除法 不 适用 于 结合 律 的 
// 性 质 ， 我 们 这 里 将 它 作 为 一 个 乘法 ， 将 右 操 作 数 取 其 倒数 
pOpFunc = Mulop; 

rightoperand = 1.0 / rightoperand ; 


} 
// 递归 做 高 优先 级 的 运算 操作 


var value = ParseArithmeticExpression(&cursor, 
rightOperand, PARSE_ PHASE_STATUS_LEFT_OPERAND | 
PARSE_PHASE_STATUS_NEED_OPERATOR, pry, pStatus); 


// 由 于 我 们 可 能 会 磁 到 在 括号 操作 符 中 的 高 优先 级 运算 的 归 约 
// 比如 考虑 这 个 表达 式 : (1+2*3) 
// 这 里 ，2*3) 会 在 同一 个 调用 级 中 ， 所 以 ) 的 输 
// 先前 的 (， 所 以 这 里 我 们 也 要 将 当前 游标 位 
// 返回 给 上 一 级 的 调用 
*ppCursor = Cursor ， 

return pOpFunc(leftOperand, value); 


二 


出 无 法 影响 到 
行 输出 


和 1 


= 


// 更 新 当前 计算 优先 级 
priority = pry; 


} 
// 清除 需要 操作 符 标 志 
status &= ~PARSE_PHASE_STATUS_NEED_OPERATOR; 


} 
// 对 于 所 有 操作 符 情况 ， 最 后 都 让 游标 往 前 走 一 格 
CUrsor+t+; 
} 
else 
// 如 果 遇 到 其 他 字符 ， 倘 若 不 是 字符 串 结束 符 则 宣告 解析 失败 
if(ch != '\0') 
{ 
isSuccessful = false; 
break; 
} 
} 
} 
while(ch != '\0'); 


// 若 解 析 失 败 ， 则 后 续 出 结果 时 不 做 任何 相关 计算 
if(!isSuccessful) 
popFunc = NULL; 


if(pStatus != NULL) 
*pStatus = isSuccessful; 


return (pOpFunc == NULL)? Jeftoperand : pOpFunc(leftOperand, rightOperand); 


} 


yA 

* 计算 输入 的 算术 表达 式 

* @param expr 输入 的 算术 表达 式 字符 
* @param result 以 字符 串 的 形式 输出 ， 设置 了 实 参 至 少 需要 提供 的 缓存 长 度 
* @return 如 果 表 达 式 解析 成 功 ， 返 回 true， 否 则 返回 false 

* 
/ 


bool CalculateArithmeticExpression(char expr[], char result[static 32]) 


让 


If(expr[0] == '\0') 
return false,; 


/*** 我 们 先 对 输入 字符 串 做 一 些 过 滤 ， 使 得 当中 出 现 的 一 些 符号 能 适 配 本 程序 */ 
var length = (int)strlen(expr) 


// 由 于 一 些 命令 控制 台 不 支持 带 有 圆 括号 ( ) 的 表达 式 ， 但 支持 方 括号 [] 表 达 式 ， 
// 所 以 我 们 这 里 可 以 将 输入 中 的 [] 再 替换 回 ( ) 。 
// 此 外 ,我 们 将 出 现 的 所 有 大 写字 母 替换 为 小 写字 母 


for(var i = 0; i < length,; i++) 


{ 
var ch = expr[i]; 
if(ch == '[') 
expr[i] = "('; 
else if(ch == ']') 
expr[i] = ) ; 
else if(ch == '$') 
expr[i] = '^'; 
else if(ch >= 'A' && ch <= 'Z') 
{ 


| 


// 由 于 ASCII 码 的 巧妙 设计 ， 大 写字 母 与 小 写字 母 正 好 相差 0x20， 


int 


// 所 以 我 们 这 里 只 需 通 过 加 上 0x20 值 就 能 方便 地 将 大 写字 母 转 为 小 写字 母 
expr[i] += Ox20; 


} 


bool ret = false; 


var value = ParseArithmeticExpression((const char**)&expr, 0.0, 
PARSE_PHASE_STATUS_LEFT_OPERAND, OPERATOR_PRIORITY_ADD, &ret); 


if(!ret) 
return ret,; 


// 我 们 将 结果 显示 为 小 数 点 后 面 跟 8 位 尾数 
sprintf(result, "%.8f", value); 


// 我 们 下 面 将 把 多 余 的 .09000 这 种 字样 给 过 滤 掉 ， 使 得 结 
length = (int)strlen(result); 

var dotIndex = -1; 

var hasE = false,; 

for(var i = 0; i < length,; i++) 


赵 
人 


上 更 好 看 一 些 


{ 
if(result[i] == '.') 
dotIndex = i; 
else if(result[i] == 'e') 


hasE = true; 


} 
// 我 们 只 有 在 仅 存 在 小 数 点 的 情况 下 做 过 滤 
if(dotIindex >= 0 && !hasE) 


{ 
var index = Jength 
while(--index > 0) 
{ 
if(result[index] != '0') 
break; 
result[index] = '\0'，; 
} 
// 如 果 dotIndex 后 面 没 有 具体 数字 了 ， 那 么 我 们 将 小 数 点 也 过 滤 掉 
if(result[dotIindex + 1] == '\0') 
result[dotIindex] = '\0'; 
} 


return true; 


main(int argc, const char * argv[]) 


// argc 用 于 存放 参数 个 数 。 在 Windows 以 及 各 类 Unix 系 统 中 ， 参数 以 空格 符 进行 分 隔 。 
// 因此 我 们 在 使 用 该 程序 时 ， 计 算 表 达 式 中 不 应 该 含有 空格 符 (包括 空格 和 制 表 符 ) 。 
// 假定 我 们 生成 的 可 执行 程序 名 为 SimpleCalculator， 那 么 在 控制 台 输 入 : 

// SimpleCalculator 1+2 是 合法 的 。 
// 而 输入 : SimpleCcalculator 1 + 2， 则 直接 输出 结果 1， 后 面 的 +2 会 被 忽略 
if(argc < 2) 


puts("No expression to calculate!"); 
return ©; 


var length = strlen(argv[1])， 
if(length == 0) 
{ 


puts("No expression to calculate!"); 
return ©; 


} 


// 对 参数 表达 式 长 度 做 截断 ， 取 由 宏 指定 的 长 度 
if(length > MAX_ARGUMENT_LENGTH) 
length = MAX_ARGUMENT_LENGTH; 


// 我 们 个 字符 串 缓存 ， 将 通过 程序 参数 传递 进来 的 字符 串 
// 便于 后 续 解 析 操 作 
char argBuffer[MAX_ARGUMENT_LENGTH + 11]; 


里 使 用 strncpy 也 使 得 在 做 字符 串 拷 贝 的 时 候 确保 长 度 不 超过 指定 的 Length 大 小 。 

// 这 里 之 所 以 使 用 strncpy 而 不 是 memcpy， 
S c 
A 


二 | 


区 


达 式 拷贝 到 当前 程序 的 栈 上 ， 


// 我 们 


| 
// 是 因为 strncpy 会 在 目标 缓存 最 后 添加 一 个 字符 串 结束 符 '\@'。 
// 该 函数 在 <string .h> 头 文件 中 
strncpy(argBuffer, argv[1], length); 


char result[32]; 
var state = CalculateArithmeticExpression(argBuffer, result); 
printf("The arithmetic expression to be calculated: %s\n", argBuffer); 
if(state) 

printf("The answer is: %s\n", result); 


else 
puts("Invalid expression!"); 


代码 清单 21-1 中 的 代码 必须 在 GCC 4.9 或 更 高 版 本 、Clang 3.8 或 更 
高 版 本 ， 以 及 Apple LLVM 8.0 或 更 高 版 本 上 才能 通过 编译 构建 。 此 
外 ， 编 译 选项 中 必须 加 入 -std=gnu11 。 


21.4 ”本章 小 结 


本 草 给 大 家 介绍 了 如 何 使 用 C 语 言 制作 一 个 基于 控制 台 的 计算 
絮 。 尺 管 这 个 功能 看 上 去 不 算 复 洒 ， 但 实际 实现 起 来 还 是 有 一 定 的 复 
杂 度 。 本 程序 中 ， 笔 者 通过 递归 来 解决 算术 表达 式 的 计算 优先 级 问 
题 ， 通 过 使 用 有 限 状态 机 来 逐 字 节 地 解析 当前 输入 符号 ， 将 它 归 类 。 
在 一 开始 先 建立 了 一 个 状态 图 ， 这 有 助 于 对 此 程序 的 理解 。 


我 们 可 以 在 Windows 以 及 其 他 类 Unix 系 统 中 编译 这 段 代 码 然后 运 
行 。 当 然 对 编译 器 的 要 求 是 GCC 4.9 或 更 高 版 本 、Clang 3.8 或 更 高 版 
本 。 如 果 各 位 在 Windows 系 统 上 的 话 ， 可 以 使 用 MS-Clang Mingw 编 译 
需 进 行 编译 构建 。 


